主体间性文集 · Intersubjectivity

世界模型的第三种可能—哈贝马斯与一个商量着来的世界.md

Twitter长文 · 世界模型

世界模型的第三种可能——哈贝马斯与一个商量着来的世界

A Third Possibility for World Models — Habermas and a World That Negotiates

✶ ✶ ✶

2026年1月，Scientific American发了一篇文章，标题是《The Next AI Revolution Could Start with World Models》。文章开头讲了一个很小的场景——

你让AI生成一段视频。一只狗在客厅里跑。它跑到沙发后面，消失了一秒钟。然后它从另一边跑出来。

项圈不见了。

镜头往回摇。沙发变了。不是同一张沙发了——刚才是loveseat，现在变成了一个三人座的sofa。

没有人让它换沙发。没有人让它去掉项圈。但AI不知道它做错了什么。因为它根本不知道有一张"沙发"需要保持不变。它不持有一个世界。它只是在每一帧预测"统计上最合理的下一个画面"。

上一帧的沙发已经不在它的记忆里了。或者说——它根本没有记忆。它有的只是模式。

这个bug看起来很小。一张消失的沙发，一条丢失的项圈。

但它指向的问题很大：我们所有人都在说"世界模型"——OpenAI说Sora是"世界模拟器"，Google和Meta在做机器人的世界模型，Yann LeCun为了世界模型离开了Meta创业—可是，如果你的模型连一张沙发都保不住，它"模拟"的是什么世界？

一个连沙发都会变的世界，不是世界。是幻觉。

而我们正在把越来越多的真实决策——自动驾驶、手术规划、金融预测、城市治理——交给这些幻觉。

问题不在于幻觉本身。所有模型都有幻觉。

问题在于——没有人可以追问这个幻觉。

你没有办法问AI："你为什么换了沙发？"因为它不知道它换了。你没有办法问它"你有多确定这个世界是连续的？"因为它根本没有一个"世界"的概念可以被追问。

它不是在描述世界。它在一帧一帧地猜世界。而你没有任何接口去追问它的猜测。

这不是一个技术问题。这是一个关系问题。

你和这个"世界模型"之间，没有可以说话的关系。

✶ ✶ ✶

◇

第一部分：困局

一、控制的极限：死的准确

有一类系统，你一进去就知道——它很强大，因为它什么都管。

Facebook的内容分发系统。你看到什么、看不到什么，不由你、不由你的朋友、不由写这条内容的人——由算法。算法的目标函数写得很清楚：最大化用户停留时间。为了这个目标，系统精确地建模了你的行为模式、情绪触发点、注意力周期。它比你更了解你自己的弱点——然后利用这些弱点让你多刷十分钟。

这是控制范式的杰作。准确、高效、可追溯——Meta的工程师可以追踪任何一条内容是如何到达你面前的。每一步都有日志。每一个推荐都有理由。从工程角度看，这是完美的系统。

币安的交易引擎也是。每一笔交易都被撮合、清算、结算——毫秒级延迟，全链路可审计。风控规则层层嵌套，异常交易实时监测。你做的每一个操作都在规则之内。规则之外的事情不会发生。

新加坡把这个逻辑推到了国家治理的层面。组屋分配、交通管理、教育分流、移民政策——每一项都是精密设计的机制，每一步都有清晰的规则和可预期的结果。运转极其良好。效率极高。争议极少——不是没有争议，是争议没有太多生存空间。

这三个系统有一个共同特征：它们都非常准确，也都非常死。

死，不是说它们不运作。它们运作得太好了。死，是说它们不允许意外。每一个不在预设范围内的行为，要么被过滤，要么被修正，要么被惩罚。系统追求的是确定性——而确定性的代价是：一切真正新的东西都会被当作噪声处理。

Facebook的内容审核系统无法区分"有害言论"和"对有害现象的批评"。它只能按模式匹配。一个讨论缅甸军事政变的帖子和一个煽动对罗兴亚人暴力的帖子，在模式匹配的层面上可能非常相似——系统选择宁可杀错不可放过。

币安在面对新型金融衍生品时的第一反应是限制，不是理解。新加坡的城市治理在面对无法预期的社会创新时——比如自发形成的地下文化社区——的默认处理也是规范化，也就是把它纳入已有的分类里。

控制范式的极限在这里：它可以让已知的东西运行得极好，但它无法容纳真正未知的东西。 当你把控制推到极致，你得到的是一个没有噪声的世界——同时也是一个没有涌现的世界。

没有涌现的世界，什么都可以预测。

但没有什么值得预测。

二、涌现的极限：活的失控

另一类系统让你看到了完全不同的东西。

2023年4月，斯坦福大学的Joon Sung Park和他的同事发表了一篇论文：Generative Agents: Interactive Simulacra of Human Behavior。他们做了一件很诗意的事——在一个叫Smallville的虚拟小镇里放进了25个AI agent，给每个agent写了一段简短的人设（名字、职业、关系、几条习惯），然后放手不管。

没有人编程让这些agent做什么。没有规则脚本。没有行为树。

两天之后，这些agent自发地组织了一场情人节派对。一个agent决定竞选镇长，其他agent开始讨论他的胜算。有agent主动约另一个agent去派对。信息在agent之间自发扩散——Sam在杂货店告诉Tom自己要竞选，Tom后来又和John聊起这件事。

所有这些社会行为都是涌现的，不是预编程的。

研究者的原话是：我们没有在社会层面设计任何东西，这完全取决于agent自己。

GPT系列的每一次能力跃升几乎都来自涌现。In-context learning——在prompt里给几个例子，模型就能学会新任务——没有人设计这个能力，它在模型规模达到某个临界点后自动出现了。Chain-of-thought推理也是。Tool use也是。这些不是特性，是惊喜。

DeepSeek也展示了类似的跳跃。

涌现的魅力是无法抗拒的。它暗示着一种可能性——也许我们不需要设计智能，我们只需要创造条件，让智能自己长出来。

但涌现的另一面是：你不知道它会长成什么。

Smallville的agent也出了问题。他们对家人说话的语气和对陌生人一样正式。他们会同时使用同一个洗手间。他们中午不去咖啡馆，去酒吧——像是集体养成了白天酗酒的习惯。

这些当然是小bug。但它们指向一个结构性问题：涌现没有方向。 你可以说"有价值的涌现"和"有害的涌现"，但在涌现发生的那一刻，你没有任何机制区分这两者。你只能事后看。

Sora生成的视频里，篮球会瞬移到篮筐里。体操运动员的身体在空中扭曲成物理上不可能的形态。水可以往上流。字节跳动和清华的联合研究直接下了结论：单纯靠扩大规模，不足以让视频生成模型发现基本的物理定律。它们学到的是表面模式——颜色、形状、运动方向——不是因果结构。

涌现范式说：先让它生长，再来修剪。

但如果你的修剪工具是在生长之后才设计的，你永远比问题慢一步。

一个完全自由联想的人不是天才，是精神分裂。天才和疯子的区别不在于涌现本身——在于涌现是否可以被追问。

三、缺失的中间层——不是平衡，是需要一种新关系

你可能以为答案在两者之间——控制多一点，涌现少一点，找到一个平衡。

这是一个直觉上说得通、但结构上行不通的想法。

"平衡"意味着在同一根轴上调参数。多一点控制 = 少一点涌现。多一点涌现 = 少一点安全。这是一个零和博弈。你永远在妥协，永远没有一个让两边都满意的点。

缺的不是一个平衡点。缺的是一个新的维度。

一种机制，不在"控制多少涌现"上做选择，而是在"涌现发生之后如何处理"上提供结构。

这种机制在人类社会里早就存在。

你允许人说出意料之外的话。但你可以追问"你凭什么这么说？"。你允许人做出意料之外的行为。但行为可以被评价、被质疑、被要求给出理由。

这不是控制。控制是提前规定你能说什么、不能说什么。

这也不是放任。放任是你说什么都行，没有人追问。

这是——商谈。

哈贝马斯花了整个职业生涯在阐述这一件事：人类之所以可以在自由和秩序之间找到路，不是因为找到了平衡，是因为拥有了追问的权利和结构。

AI世界模型缺的正是这个。

◇

第二部分：哈贝马斯的刀

四、有效性宣称：不是三个标准，是一种可以追问的关系

哈贝马斯1981年出版了《交往行动理论》（The Theory of Communicative Action）。这本书有一千多页，写得极其艰涩。但它的核心可以用一段话说清楚。

每一个以达成理解为目的的语言行动，都同时提出三种宣称——

真实性（Wahrheit）：我说的符合客观世界。"明天会下雨"——这要么是真的，要么不是。

正当性（Richtigkeit）：我说的符合我们共同承认的规范。"你应该带伞"——这个"应该"背后有一套关于关心、责任、社交礼仪的规范在支撑。

真诚性（Wahrhaftigkeit）：我说的是我真正相信的。我不是在敷衍你，不是在操纵你，不是在说我自己都不信的话。

哈贝马斯的洞见不在于发现这三种宣称——这并不难想到。他的洞见在于指出：这三种宣称的功能不是用来"判分"的，是用来"追问"的。

当你觉得对方说的不对，你追问真实性——"你凭什么说明天会下雨？"

当你觉得对方的做法有问题，你追问正当性——"你凭什么觉得你可以替我决定？"

当你觉得对方在说谎或敷衍，你追问真诚性——"你真的是这么想的吗？"

只要每一个宣称都可以被追问，对话就不会塌缩。不会塌缩成独断——因为独断意味着某些宣称免于追问。不会塌缩成混乱——因为追问提供了方向和结构。

哈贝马斯把这个叫做"理想言说情境"（ideale Sprechsituation）：没有人因为身份或权力而免于被追问。每个参与者都可以要求对方为自己的宣称提供理由。理由本身也可以被追问。

这不是乌托邦。这是一个过程——一个永远不终止的、通过追问逼近共识的过程。

共识不是终点。共识是"到目前为止没有人能提出更好的反对理由"。

这就是商谈。

五、AI预测的三重宣称——真实性、正当性、真诚性

把哈贝马斯的框架放到AI预测上。每一次AI做出一个预测、一个决策、一个推荐，它实际上同时提出了三种宣称——即使它自己"不知道"。

真实性宣称：你说的符合现实吗？

Sora第一代生成的视频里，水往上流，篮球瞬移，手指有六根。这是真实性宣称的赤裸裸的失败——生成内容和物理现实不符。但更微妙的真实性问题藏在日常预测里。

Epic脓毒症模型说"这个患者脓毒症风险低"——这个判断的真实性如何？密歇根大学的研究告诉我们：三分之二的脓毒症患者被这个判断放过了。模型的AUC是0.63，比它自己宣称的0.76到0.83差了一个世界。

但没有人追问。数百家医院直接信了。

正当性宣称：你的建议站在谁的立场上？

当一个医疗AI系统推荐优先治疗某个患者而非另一个，这不只是一个预测问题——是一个规范问题。你用了什么原则？紧急程度优先？预期生命年数最大化？先到先得？

当前的对齐方法——RLHF、Constitutional AI——把价值观烧进模型权重里。问题是：烧进去之后不可追问。你无法知道模型在某个具体推荐上用了什么价值前提。你也无法在运行时说"换一套原则重新算"。

这就像一部法律被硬编码到芯片里。你只能遵守。不能辩论。不能修订。不能在具体案例中做例外处理。

真诚性宣称：你真的知道你在说什么吗？

这是三层中最微妙的一层。AI没有"内心世界"。它不会"故意"撒谎。但它可以以一种结构性的方式不真诚——当它不知道的时候，表现得像知道。

Epic脓毒症模型以确定的语气给出风险评分，没有附带任何关于这个评分可靠性的结构化信息。密歇根大学的医生们不知道，当模型说"低风险"的时候，这个判断背后的不确定性有多大。模型的"自信"和它实际的能力之间存在一个巨大的裂缝。但这个裂缝对使用者不可见。

一个不表达自身不确定性的系统，在结构上就是不真诚的——不是因为它在欺骗，是因为它的输出方式隐藏了它自身的局限。

六、核心转折：世界模型不是正确的表征，是一组可以被追问的宣称

到这里，可以说出这篇文章最关键的一句话了。

控制范式追求一个"正确的世界模型"——一个和现实严格对应的表征。如果模型足够准确，一切问题都会消失。

涌现范式追求一个"自由生长的世界理解"——让模型自己探索、自己建构对世界的理解。如果探索足够深入，真正的智能会出现。

哈贝马斯给出第三种可能：

世界模型不是正确的表征。世界模型是一组宣称。每一个宣称都可以被追问。

"明天降水概率80%"——这不是一个事实。这是一个宣称。它的真实性可以被追问（你凭什么这么判断？）。它的正当性可以被追问（这个预测的阈值设定对谁有利？）。它的真诚性可以被追问（你的不确定性有多大？）。

追问不终止于某个最终答案。追问维持的是追问本身的可能性。

这看起来好像什么都没解决。没有给出"正确答案"，也没有消除不确定性。

但它解决了最根本的问题：它让你和AI之间有了一种可以"说话"的关系。

不是"我问你答"。不是"你输出我接受"。是——你说了一个东西，我可以追问，你必须回应，我可以再追问，你可以修正或坚持但必须给出理由。

这就是商谈的结构。

这个结构里，涌现被重新定义了：涌现是AI提出了一个设计者没有预见的宣称。 只要这个宣称可以被追问、可以在商谈中接受检验——涌现就是安全的。危险的不是涌现本身，是不可追问的涌现。

控制的问题不是控制本身，是它让追问变得不必要。

涌现的问题不是涌现本身，是它让追问变得不可能。

商谈同时解决了两个问题：涌现被鼓励，但追问永远在场。

◇

第三部分：商量着来的Chaos世界的三种可能性

七、诚实的Chaos——以现实收敛

如果你正在设计一个复杂系统——不管是一个AI平台、一个治理协议、一个多agent架构、还是一个新型组织——你面对的第一个设计决策是：你允不允许系统说"我不知道"？

大多数设计者的直觉是不允许。用户要的是答案，不是"我不确定"。投资人要的是确定性，不是一张不确定性地图。一个能力看起来有限的系统不会赢得市场。所以你把不确定性藏起来。你让系统永远以确定的语气输出结果。你把置信度调到看起来很高的数字。

Epic脓毒症模型就是这么设计的。它的输出是一个光秃秃的风险评分。没有附带"这个评分的可靠性是多少"。没有附带"在什么条件下这个评分会反转"。没有附带"这个评分在你的患者群体上到底验证过没有"。数百家医院采用了这个设计。三分之二的脓毒症患者被漏掉了。

这不是算法的失败。这是设计哲学的失败。系统被设计成了一个不会说"我不知道"的东西——然后它在不知道的时候沉默了，而沉默被当成了安全。

如果你要设计一个商量着来的Chaos世界，第一条设计原则是：把诚实做成系统的结构，而不是功能。

具体地说——你的系统的每一个输出，必须同时输出三样东西：

结论本身。不确定性的结构化分类——是数据不足、模型局限、还是问题本身的内在不可预测性？这三种对应完全不同的后续处理。以及反转条件——在什么情况下，这个结论会反过来？

反转条件可能是最有设计价值的部分。"降水概率80%"是一个点。"降水概率80%，但如果低压系统偏北200公里则降到30%，偏北的概率约15%"是一张地图。你给使用者的不再是一个要么信要么不信的结论，而是一个可以被探索的决策空间。

Chaos不是无序。Chaos是还没有被标注的有序。你的系统不需要消灭Chaos——它需要标注Chaos的地形。哪些区域是实地（模型能力强、数据充分、预测稳定），哪些区域是迷雾（数据稀疏、模型外推、高不确定性），哪些是断崖（看起来像实地但反转条件极容易被触发）。

这就是以现实收敛。你不压平Chaos。你让Chaos中可以落脚的地方显现出来。

对设计者来说，这意味着一个根本的架构决策：不确定性不是附加信息，是输出的核心组成部分。 它不是一个可选的"详细模式"，不是一个高级用户才看的debug面板。它和结论本身同等重要。你怎么呈现不确定性、怎么分类不确定性、怎么让下游决策者基于不确定性的不同类型做出不同的反应——这些是核心设计问题，不是边角料。

字节跳动和清华的联合研究发现，视频生成模型在扩大规模之后仍然无法学会基本物理定律——它们学到的是表面模式，不是因果结构。这个发现的设计启示是：如果你的系统在某个维度上有结构性的盲区，诚实地标注这个盲区比假装它不存在要有价值得多。Sora第一代的问题不是水往上流——是它不知道自己不知道水应该往下流。如果系统能在生成物理不一致内容时同时标注"本输出在物理一致性维度上的置信度较低"——使用者的决策质量会完全不同。

你设计一个诚实的系统，不是因为诚实是美德。

是因为在一个Chaos世界里，一张诚实的地图是唯一可以让所有参与者开始协作的基础。

八、可追问的Chaos——以商谈通行

有了地形图之后，下一个设计问题是：你允不允许你的系统被追问？而且——你把追问设计成什么？

大多数系统的追问能力是零。用户得到一个输出。想要理由？没有接口。想要替代方案？重新问一遍，碰运气。想要知道结论对哪些假设敏感？自己去做实验。

Epic脓毒症模型被数百家医院使用了好几年，直到密歇根大学的研究者做了一件这些医院本该在部署第一天就做的事：外部验证。这件事花了一篇JAMA论文、几个月的数据分析、大量的学术和媒体压力才完成。

如果追问是系统的一等公民——不是事后的学术研究，而是运行时每一次输出都附带的可追问结构——每家医院在部署当天就可以做这件事。

可追问性是一个架构决策，不是一个UI特性。

具体地说，你需要设计三层追问接口：

第一层："凭什么？"——依据链的展开。 你的系统给出了一个结论，使用者追问理由。系统不是重新生成一段解释（那只是事后叙事），而是展开推理过程中的关键节点：结论主要依赖了哪些数据点？哪些中间推断？每个关键节点的sensitivity有多高——拿掉它，结论变化多大？这不需要展示全部计算过程——那既不可能也无意义。只需要展示骨架。

第二层："换个角度呢？"——价值框架的可切换。 当系统的输出包含规范性判断（优先级排序、资源分配建议、风险阈值设定），使用者可以追问：你站在谁的角度？你用了什么原则？系统必须能展示它当前使用的价值前提，同时给出在替代价值框架下的替代输出。不是系统替你选——是系统把选项和选项背后的逻辑摊在桌上。

当前的对齐方法——RLHF、Constitutional AI——把价值观烧进了模型权重。烧进去就不可追问了。你不知道模型在某个具体推荐上用了什么价值前提。你也不能在运行时说"换一套原则重新算"。这对于设计者来说意味着：你做的不是一个给出"正确答案"的系统，你做的是一个把价值选择的权力交还给使用者的系统。

第三层："还能追问什么？"——追问的引导。 使用者不一定知道该追问什么。好的追问系统不是被动等待追问，而是主动建议追问方向。"你可能想知道这个结论对X假设的敏感度"、"在Y情境下结论会发生显著变化"、"当前推理的脆弱点在Z"。这不是替使用者思考——是降低追问的门槛。

但最关键的设计决策还不在这三层里。

最关键的决策是：追问必须能改变系统行为。

如果使用者追问了，系统展示了一堆理由，但追问不能触发任何修正——那追问就是装饰。密歇根大学追问了Epic，Epic被迫花了一年多重新调整模型、修改推荐阈值。这个追问改变了系统行为。但这个改变花了太久，经过了太多迂回。

你设计的系统应该让这种改变实时发生。使用者追问——发现了一个有问题的假设——提供了新的信息或约束——系统基于追问重新推理并给出修正后的输出。追问→回应→修正→可再追问。这是一个循环，不是一次性事件。

而且——这是和第六章的论点直接相连的——追问必须是双向的。

如果只有人类追问AI，那你设计的仍然是一个主从系统。人类审查机器，机器被动接受。这不是商谈，是审讯。

斯坦福Smallville的agent之所以展示出那么丰富的社会行为，正是因为它们之间存在某种追问结构——Sam告诉Tom自己要竞选，Tom不是无条件接受这个信息，他后来和John讨论Sam的胜算。信息不是单向灌输，是在agent之间被检验、被传播、被修正的。但Smallville的追问深度严重不够——agent之间的互动停留在信息交换层面，没有深入到对彼此行为正当性的追问。所以agent会做出中午去酒吧、同时使用同一个卫生间之类的荒谬行为——没有谁追问"你为什么中午去酒吧？"

对你这个设计者来说，教训是：如果你想设计一个真正能自我修正的多agent系统或复杂系统，你需要在系统内部设计agent之间的追问机制——不只是信息共享，而是有效性追问。 一个agent可以挑战另一个agent的真实性（"你的信息来源可靠吗？"）、正当性（"你的行为符合我们共同的规范吗？"）、真诚性（"你对自己的判断有多确定？"）。

涌现在这样的系统中被鼓励——但涌现必须经得起追问。经过追问的涌现比未经追问的控制更可信赖。一个agent做了一件没有人预期的事——好。但如果这件事经不起其他agent的追问，它就被标记为"未验证的涌现"，不会被扩散到整个系统。

追问不消灭涌现。追问让涌现有了一个被检验的机会。

你要设计的不是一个"正确"的系统。你要设计的是一个追问权永远开着的系统。追问权不是一个功能开关。它是架构的根基。没有任何角色——包括系统的设计者自己——可以关闭追问接口。

这一条最难做到。因为你正在设计一个可以质疑你自己设计决策的系统。

但这恰恰是它最有价值的地方。

九、博弈的Chaos——以张力存活

作为设计者，你现在面对最后一个——也是最反直觉的——设计原则：不要追求系统的内部一致性。

真实性、正当性、真诚性——三种宣称之间不会永远和谐。它们之间存在结构性的张力。作为设计者，你的任务不是消除这种张力。你的任务是让张力成为系统自我演化的动力。

一个预测可以是真实的，但不正当。Epic脓毒症模型如果在某个特定患者亚群上预测极其准确——但这个亚群恰好排除了少数族裔——那么真实性满分，正当性严重缺陷。研究已经表明，脉搏血氧仪在不同肤色人群中的准确度差异会传导到脓毒症预测模型中，放大既有的不平等。准确的歧视仍然是歧视。真实性和正当性在这里直接冲突。

一个建议可以是正当的，但不真诚。一个AI系统在敏感话题上给出政治正确的回应——完美符合社会规范，但掩盖了自己实际的不确定性。"这是一个复杂的问题，需要多角度看待"——规范上无懈可击，信息量约等于零。正当性和真诚性冲突了。

一个表态可以是真诚的，但不真实。模型诚实地告诉你它认为什么——但它认为的恰好是错的。诚实的错误。

如果你作为设计者试图消除这些冲突——让系统的每一个输出同时在三个维度上都达到最优——你做的事情其实是控制范式的变体：预先定义好什么是"正确答案"，然后强制系统在所有维度上趋近它。

但哈贝马斯的核心洞见在这里：商谈不追求冲突的消除。商谈追求的是冲突的可处理性。

三种宣称之间的张力不是bug。它是系统保持活性的条件。

如果三种宣称永远一致——意味着没有真正的冲突需要处理，也就没有真正的商谈需要发生。系统退化成了一个静态的、自洽的、不再演化的东西。

真正活的系统里，三种宣称持续地互相牵拉。真实性要求如实呈现数据（即使数据揭示了不舒服的模式）。正当性要求考虑呈现的后果（谁被伤害了？谁被忽略了？）。真诚性要求暴露所有不确定性（即使这让使用者焦虑）。三者之间的每一次冲突，都是系统被追问、被修正、被推向更好状态的契机。

Sora的演进是一个绝佳的案例。第一代Sora，真实性宣称严重失败——物理规律混乱，水往上流，篮球瞬移。OpenAI在Sora 2中大幅改进了物理一致性——投篮没中，球从篮板弹回。但Sora 2仍然不完美。研究者仍然在追问。每一次追问都在推动系统修正自己的真实性宣称。而真实性的改进又会带来新的正当性问题——当AI生成的视频越来越逼真，关于深度伪造、肖像权、信息操纵的规范性追问就越紧迫。

这个博弈不会有终点。博弈本身就是世界模型持续自我修正的动力。

对你这个设计者来说，这意味着三件事：

第一，设计张力的容器，而不是张力的解决方案。 你的系统需要一个结构，让三种宣称之间的冲突可以被表达、被看见、被讨论——而不是在系统内部被强制调和。当真实性和正当性冲突的时候，系统不是在两者之间取一个中间值——系统展示冲突本身，并邀请参与者加入商谈。

第二，让仲裁规则本身可被追问。 你在设计系统时设定的规则——什么样的涌现需要人类审查？什么阈值触发警报？什么价值框架作为默认？——这些规则本身不是神圣不可侵犯的。系统中的参与者（使用者、下游系统、审计者）必须能追问这些规则、挑战这些规则、推动这些规则的修订。一个规则如果不好——追问它。一个阈值如果过时——追问它。一个价值前提如果有偏见——追问它。包括设计者自己的设计决策。

第三，用博弈驱动演化，而不是用版本更新驱动演化。 传统的系统演化是：发现问题→工程师修复→发布新版本。这是控制范式的节奏。商谈范式的节奏是：冲突被检测→追问被触发→商谈发生→系统实时调整。不是一年发两个大版本，是系统每时每刻都在通过内部的张力和外部的追问进行微调整。

这就是你在设计的东西——不是一个"正确的"系统，不是一个"稳定的"系统，而是一个有生命力的系统。它的生命力来自三种宣称之间永不终止的博弈。它的安全性来自博弈发生在商谈之中——有追问、有回应、有修正的可能。

诚实让Chaos有了地形。追问让Chaos可以通行。博弈让Chaos保持活力。

三者加在一起——就是你可以建造的东西：一个商量着来的世界。

◇

✶ ✶ ✶

回到那只狗和那张沙发。

狗跑到沙发后面。项圈消失了。沙发变了。AI不知道发生了什么。

2025到2026年之间，研究者们开始尝试一种新路径——4D世界模型。NeoVerse、TeleWorld，这些还停留在预印本阶段的工作，试图让AI在生成视频的同时维护一个持续更新的内部场景地图。狗跑到沙发后面——场景地图记住了：这里有一张loveseat，狗戴着棕色项圈。当狗从另一边跑出来，生成器不再是从零开始猜下一帧——它向场景地图追问："沙发还在吗？项圈还在吗？"

这就是追问。

不壮烈。不哲学。就是一个系统在生成下一步之前，向自己的内部世界表征问了一句"凭什么"。

这还是非常早期的工作。但方向是对的。

因为方向的意思是：世界模型不是一个更大的神经网络、不是更多的训练数据、不是更强的算力——世界模型是一个可以被追问的内部结构。追问让沙发保持为沙发。追问让项圈不会消失。追问让世界不在帧与帧之间悄悄瓦解。

放大这个逻辑。

自动驾驶的世界模型——前方有行人，追问：行人还在吗？行人的意图是什么？如果行人改变方向呢？

金融预测的世界模型——市场将上涨，追问：你凭什么这么判断？哪些假设如果不成立，结论会反转？

城市治理的世界模型——应该在这里修一条路，追问：对谁有利？对谁不利？用的是什么原则？

每一个领域的世界模型，最终都面对同一个问题：你的世界，可以被追问吗？

如果可以——那你有了一个真正的世界模型。不是因为它正确，是因为它可以被发现哪里不正确。

如果不可以——那你有的只是一个更精致的幻觉。一个沙发会变、项圈会消失、但没有人能追问"为什么"的幻觉。

· · ·

所以这篇文章最后说的不是一个技术方案。

说的是一种关系。

控制说：我替你造好了世界，住进去就行。

涌现说：世界会自己长出来的，等就行。

而商谈说——

来，这个世界我们商量着造。

你先说。

我觉得沙发不应该变。

为什么？

然后就接着谈。

这就是全部。

✶ ✶ ✶