2026-06-15

2026-06-15 — 题图

Tim Genewein 和他在 DeepMind 的十几个同事，最近往 arXiv 上扔了一份 70 页的报告。

说真的，我一开始以为就是个普通的 survey paper，打开一看发现...这玩意直接把"AGI 之后怎么办"这件事，从科幻拉到了工程层面。

2026-06-15 — 段落图

怎么说呢，过去十年我们聊 AGI 聊得够多了，但很少有人认真讨论，AGI 之后呢。

这篇报告的标题很直白，叫《From AGI to ASI》。作者团队里有 Shane Legg，DeepMind 的联合创始人，也是"AGI"这个概念在业内的早期推广者。还有 Marcus Hutter，AIXI 这个机器智能理论极限框架的提出者之一。

坦率的讲，光看这个作者阵容，你就知道这不是一篇随便写写的东西。

那么问题来了，什么是 ASI？

报告给了一个很工程化的定义，AGI 是"胜任级"的人类水平智能，也就是在大多数认知任务上达到人类中位数水平的那种系统。

而 ASI，artificial general superintelligence，是在几乎所有人类感兴趣的任务和领域上，超越大型人类专家集体能力的系统。

注意这里用的是"集体"，不是"个人"。

也就是说，ASI 不是一个天才，它是一个能干的组织，规模相当于一个大型研究机构或大企业，只不过它是个 AI。

怎么去衡量这件事呢，报告提到了 Legg-Hutter score，一个形式化的智能度量，定义是智能体在所有可计算任务上的平均表现。

在这个度量下，智能是个连续体，不是台阶式的。所以你不需要精确定义 AGI 和 ASI 的分数阈值，只需要知道，它们之间有一个巨大的鸿沟。

那么，AI 为什么会停在 AGI 而不是继续往上走呢？

答案是，不太可能停。

报告列出了数字智能相对于生物智能的一系列优势，而且这些优势随着算力增长会越来越明显。

我直接搬几个核心的过来。

第一，输入输出速度，AI 可以越来越高速地接收和生成信息，今天的 LLM 几秒钟能消化好几本书。

第二，内部处理速度，更多算力意味着更深更广的计算，思考得更快。

第三，工作记忆和存储，工作记忆容量和内存带宽可以远超人类，今天的系统已经能记住互联网的大部分。

第四，独立于基底，AI 可以从一台计算机迁移到另一台，甚至运行时迁移，升级硬件很方便。

第五，无损复制，不仅是代码可以复制，内存状态，也就是它的"一生经验"，也可以完美复制。这带来了备份、恢复、随时生成实例的能力。

第六，高带宽经验共享，数字输入输出流可以被存储、共享、重放，同质化的 AI 实例之间甚至可以直接共享学习信号，比如平均梯度更新。

你想想看，这几个优势叠加起来，意味着 AI 的"社会"演进速度，可能远远快于人类，因为人类还得靠那个低带宽的语言瓶颈来传递知识。

那么 ASI 是全知全能的吗？

也不是。

报告同样列出了一堆基本限制。基础物理学层面的，光速作为信息传播的极限，兰道尔原理关于计算能耗，布雷默曼极限关于计算速度上限，贝肯斯坦上限关于有限空间能容纳的最大信息量。

2026-06-15 — 段落图

还有实时性的限制，物理世界在实时运行，复杂系统比如天气、生物、经济没法被高精度模拟。

物理操控的限制，不是所有逻辑上可能的物质配置都能在有限空间和能量内被实现。

无知、可观测性、可控性的限制，认知上的不确定性，测量精度的有限性。

复杂性理论的限制，P vs NP vs PSPACE 之类的，最坏情况计算界限。

逻辑的限制，哥德尔不完备定理，停机问题。

所以 ASI 再强，也有天花板。但这个天花板比人类的天花板，高出不是一两个数量级。

好，下面聊重点，从 AGI 到 ASI 的四条潜在路径。

第一条，缩放计算、模型和数据。

这是过去十年我们一直在干的事，更多的算力，更大的模型，更多的数据。

报告里有一组数据我觉得很有意思，过去十年里，用于最大 ML 训练运行的计算量每年增长约 4 倍。而这个 4 倍是三个因素相乘的结果，硬件制造改进每年约 1.5 倍（摩尔定律相关），对计算硬件的投资每年约 2.5 倍，算法效率每年约 3 倍，甚至可能到 6 倍。

三个乘起来 1.5 乘 2.5 乘 3 约等于 11.25，保守取整为每年 10 倍。这个数字叫有效算力，effective compute。

也就是说，今天的模型每年大概能"白嫖"一个数量级的算力提升。

假设到人类水平的 AGI 可用时，基础模型进展进入了平台期，但有效算力继续以 10 倍的速度增长一段时间。即使 AGI 最初运行成本很高，只能跑 1000 个实例，一年后就是 10000 个，五年后就是一亿个。

或者以快一百倍的速度跑 100 万个。

这条路径的核心问题是，"数量上的充分增益是否会导致定性上的飞跃"，说人话就是，缩放够了吗。

报告的态度是，可能够，但有摩擦。

第一个摩擦是数据墙。高质量文本数据预计将在本十年后期耗尽。但合成数据、模拟、智能体交互数据这些可以缓解，具体能缓解多少是开放问题。

第二个摩擦是经济与自然资源。持续扩展需要越来越多的投资、能源、稀土、土地，这些能不能跟上，是悬而未决的。

第二条，算法范式转变。

当前的 AI 范式大家都清楚，在大量人类生成数据上预训练大型 Transformer，然后微调，加 test-time scaling，加工具，加检索，加 agent 脚手架。

报告承认这套范式在演进，但要达到 AGI 甚至 ASI，可能需要更戏剧性的变化，比如全新的架构或优化过程。

报告里提了几个方向，比如转向脉冲神经元和神经形态硬件，转向基于 RL 的预训练，转向世界模型的显式表示。

还有一个有意思的方向是 Mamba 和 S4 这样的线性时间序列架构，可以消除 Transformer 注意力的二次复杂度瓶颈，让系统处理任意长度的上下文。

但范式转变本质上难以预测，这条路径的主要不确定性也在这里。

第三条，递归自我改进，recursive self-improvement。

这是最科幻的一条，也是很多人担心"智能爆炸"的来源。

核心逻辑是，AI 系统帮助改进 AI 研发，改进后的 AI 又能更好地帮助 AI 研发，形成正反馈循环。

报告把这种递归改进分成了四种形式。

第一种，硬件改进，AI 设计更好的芯片和加速器。

第二种，数据改进，AI 策展、生成、模拟更高质量的数据集。AlphaZero 的自举动态就是这个思路，测试时搜索的结果蒸馏回网络，反复迭代。

2026-06-15 — 段落图

第三种，代码改进，传统意义上的"AI 写更好的 AI"。

第四种，劳动分工，类似人类社会的专业化，提高效率，释放资源用于更多专业化。

报告把这四种映射到人类进化上，对应遗传进化、文化进化、协作进化。

有意思的是，报告指出非自主形式的递归改进已经发生了，比如神经架构搜索、自动超参数微调、AI 辅助芯片设计、自动课程生成、用世界模型做模拟。FunSearch 和 AlphaEvolve 这些系统已经证明了 LLM 引导的程序搜索可以发现新颖的数学构造和算法。

但真正戏剧性的递归改进，也就是完全自主的智能爆炸，目前还没有历史先例。报告的态度是，不能排除，但也不知道会发生得多快。

第四条，多智能体协调与群体代理。

这条路径的核心想法是，超级智能不一定要在单个模型里实现，它可以从大量 AGI 代理的精心编排或自组织交互中涌现。

就像人类个体智力有限，但人类集体可以搞出曼哈顿计划、阿波罗计划一样。

报告里用了"group agent"这个概念，一群 AGI 可以形成一个有自己表征和动机状态的实体，超越任何一个个体的认知能力。

具体形式可以是高度同质化的、被精心编排的集体，类似《星际迷航》里的博格集合体，也可以是异质化的、通过类似市场的动态自组织的专家系统。

报告还提了一个我之前没太想过的点，AGI 首席执行官或政治家，可能在非常字面的意义上能和每一个员工或选民"交谈"，因为它们的通信带宽几乎没有限制。这会大大减少对深层层级的需求，缓解官僚摩擦。

但这条路径上的核心问题是，多智能体 scaling 的规律是什么，我们还不知道。

一个同质化的 LLM 集体（可能带不同提示），能不能真正产生协同效应，是一个开放研究问题。

好，四条路径讲完了。报告接下来讨论的是摩擦和瓶颈。

我整理一下，主要有六个。

数据墙，前面讲过，高质量数据不够用了，模型规模增长超过了人类生产新数据的速率。

经济与自然资源需求增长过快，投资、能源、稀土、数据中心选址，这些跟不上 scaling 的步伐。

神经范式不足，单纯靠大型预训练神经网络加上后训练、test-time scaling、脚手架、工具使用，可能根本达不到 AGI。

研究变得越来越难，低垂的果实摘完了，剩下的想法越来越难找，需要指数级增长的投入才能维持线性进展。

抽象屏障，abstraction barrier，这是我觉得最有意思的一个瓶颈。这个假设由 Lerchner 提出，说的是主要在人类抽象上训练的 AI 系统，可能受限于现有的概念框架。

报告里举了个例子，如果一个现代基础模型在同样多的 token 上训练，但内容只限于前工业化、前牛顿时代的科学知识，它能推理出广义相对论吗？几乎不可能，因为它没有微积分、万有引力、电磁学这些概念基元。

2026-06-15 — 段落图

这意味着，要实现真正的 ASI，系统必须最终执行"扎根的概念发现"，从原始的、高维的数据中抽象出新的概念基元。这是个花了人类全社会数千年才达到当前世界理解水平的过程。

如果抽象屏障是关键限制，它会把一个物理的、线性的放缓引入递归自我改进循环，把智能增长速度限制在经验科学的速度，而不是计算扩展的速度。

最后一个，蓄意放缓。流氓行为者、事故、滥用、社会反弹，可能导致对 AI 能力提升的故意放缓或监管上限。

但报告也指出，国家经济和军事竞争可能压倒这种放缓压力。监管套利的问题很难解决。

好，现在聊一个理论上的东西，Universal AI 框架，也就是 AIXI。

这个有点技术性，可以跳过，但你如果想知道机器智能的理论上限是什么，这是绕不开的。

AIXI 是一个数学上被证明在所有可计算环境上平均最优的智能体。它使用 Solomonoff 归纳作为世界模型，能在不确定性下行动，处理交互式决策，自动平衡探索和利用。

关键问题是，AIXI 是不可计算的。它只是理论极限，但我们可以从下方近似它，而且保证会随着更多算力和运行时间得到提升。

这个框架给了我们一些非同寻常的论据，解释为什么当前的 AI 范式（包括预训练、微调、test-time scaling）有潜力被推进到 ASI 领域，而不会遇到根本的理论阻碍。

但这些论点既不完整也非定论，不排除今天 AI 范式的根本性缺陷在不久的将来变得显而易见。

报告的结尾是一长串开放性研究问题，我挑几个我觉得最值得关注的。

第一，数据墙能不能被克服，合成数据、模拟、智能体交互数据够不够用。

第二，定量预测模型的开发，把有效算力的增长、AI 能力提升、宏观经济效应结合起来。

第三，ASI 的基准测试怎么设计，今天的基准在人类水平饱和太快了，我们需要能评估超人类能力的方法。

第四，递归改进动态怎么建模，什么时候指数增长会进入平台期。

第五，多智能体 scaling 的规律是什么，群体智能怎么随实例数扩展。

第六，抽象屏障到底有多严重，AI 能不能从原始数据中发现新概念。

第七，AI 安全和对齐，超人类 AI 到底更容易还是更难对齐。

怎么说呢，看完整篇报告，我的一个感受是，DeepMind 这帮人不是在预测未来，他们是在画一张认知地图，把不确定的地方明确标出来。

报告最后引用了 Turing 1950 年那句话，"我们只能看到前方很短的距离，但我们可以看到那里有很多需要做的事情"。

这句话放在 2026 年，依然成立。

说真的，过去几年大家聊 AGI 聊得有点疲了，要么是末日叙事，要么是乌托邦叙事。但这篇报告给了一个更冷静的视角，不是说 ASI 一定会来，也不是说它一定不会来，而是说我们需要认真研究从 AGI 到 ASI 的路径上的每一条岔路，每一个瓶颈，每一个开放问题。

这个世界不缺预测，缺的是把不确定性明确化的能力。

太牛逼了，这种把"我不知道"说得这么理直气壮而且这么有结构的方式，反而比那些言之凿凿的预测更有价值。

最后说一句，AGI 是不是已经在我们身边了，这是另一个话题，今天不展开。但如果你问我 AGI 之后会发生什么，这篇报告至少给了我们一个认真思考的起点。

2026-06-15 — 段落图

以上，既然看到这里了，如果觉得不错，随手点个赞、在看、转发三连吧，如果想第一时间收到推送，也可以给我个星标⭐～谢谢你看我的文章，我们，下次再见。

/ 作者：卡兹克 / 投稿或爆料，请联系邮箱：wzglyay@virxact.com