AGI 时间线与定义 (AGI Timeline & Definition) 概念
DeepMind 的 AGI 定义 [来源:podcast,Demis Hassabis,当事人视角]
Demis 的高标准定义
- 具备人类所有认知能力
- 能创造新科学、提出新猜想、新假设
- 物理 AI(robotics)真正 work
- 「不只是通过基准测试」
与 OpenAI 等同行的主要区别:Demis 明确将 robotics 和科学发现能力纳入 AGI 定义,而非仅关注语言/推理能力
时间线:5-10 年(Demis,2025/4)
- 比 Sam Altman 等同行更保守
- 原因:对 AGI 要求更高——包括具身智能和科学发现
AGI 的五大缺失拼图
1. 一致性 (Consistency) [Demis + Koray]
- 当前模型:IMO 金牌 vs. 高中逻辑题犯错 = 「jagged intelligence」
- AGI 要求 consistent performance across the board
- 部分原因是 tokenization 问题(如字母计数错误)
- 可逐个修复,「修完后看还剩什么」
2. 推理 / 思考 (Reasoning) [Demis]
- thinking 系统在推理时间分配上效率仅 ~50%
- 不够可靠地使用工具 double-check 输出
- 需要学会「停下来,回顾并修正即将输出的内容」
3. 持续学习 (Continual Learning) [Demis + Jeff Dean]
4. 世界模型 (World Models) [Demis]
5. 可靠性 (Reliability) [Koray]
- 不是峰值能力不够,是不稳定
- Agent 需要每步 99%+ 正确率(多步串联后成功率急剧下降)
可能需要的突破数量 [来源:podcast,Demis Hassabis,当事人视角]
- 「可能需要 2-3 个 Transformer 级别的突破」
- 在已讨论的领域(推理、记忆、持续学习、世界模型)中有 3-4 个
- 「可能还有 1-2 个我们尚未讨论的」
- 但纯 scaling 成功的概率也有一些
DeepMind 的策略 [来源:podcast,Demis Hassabis,当事人视角]
- 50% scaling + 50% innovation
- 「all-court press」——同时推进纯研究、中期研究和应用研究
- 当 terrain 变难时 = DeepMind 的优势期(需要 worldclass research,不只是工程)
收敛路径 → proto-AGI [来源:podcast,Demis Hassabis,当事人视角]
- 需要把 Gemini + Genie + Simma + world models + Nano Banana 收敛为一个统一大模型
- 这个收敛版可能是 proto-AGI 候选
后 AGI 准备 [来源:podcast,Demis Hassabis,当事人视角]
- Shane Legg 领导 post-AGI 团队
- 研究方向:新经济体制(UBI + 直接民主投票)、post-scarcity 社会
- 变革规模:工业革命 10 倍大、10 倍快(decade vs. century)
- Demis: 「很惊讶经济学家和社会学家没有更多投入这个议题」
与其他概念关系