AGI 路径 (Path to AGI) 概念
定义
DeepMind 对 AGI(通用人工智能)的定义、时间线判断和技术路径。这是 DeepMind 所有战略决策的北极星——Hassabis/Legg/Silver 等创始团队从 2010 年起就以 AGI 为终极目标。
AGI 定义
- Shane Legg 定义:在绝大多数经济上有价值的认知任务上达到或超越人类专家水平 [来源:podcast,当事人视角]
- Hassabis 补充:不仅是模仿人类,更是能发现人类不知道的新知识(Move 37 标准)[来源:podcast,当事人视角]
时间线判断
| 来源 | 判断 | 置信度 |
|---|---|---|
| Shane Legg(Co-founder) | 2028-2030 | 明确给出时间窗口 [来源:podcast,当事人视角] |
| Demis Hassabis(CEO) | "Years, not decades" | 比 Legg 稍谨慎但方向一致 [来源:podcast,当事人视角] |
| Anca Dragan(Safety Lead) | 比之前认为的更快 | 10年前觉得有充足时间,现在感到紧迫 [来源:podcast,当事人视角] |
| Oriol Vinyals(Gemini Co-Lead) | 暗示 Agentic AI 是通往 AGI 的中间里程碑 | [来源:podcast,当事人视角] |
技术路径:五层叠加模型
Hassabis 在多次访谈中阐述的 AGI 路线图可归纳为五层叠加:
Layer 5: Memory(长期记忆与持续学习)
Layer 4: Planning & Search(树搜索 + 多步推理)
Layer 3: World Model(物理世界内在理解)
Layer 2: RL / Self-play(超越人类数据天花板)
Layer 1: LLM Pre-training(压缩世界知识的基座)
[来源:podcast,当事人视角,综合 Hassabis/Legg/Silver/Vinyals 多次论述]
Layer 1: LLM 基座
- 预训练吸收人类全部知识 → 强大的语言/推理/知识基础
- 但有"人类数据天花板"——Silver 认为这是根本局限 [来源:podcast,当事人视角]
Layer 2: RL / Self-play
- AlphaZero 证明了关键原理:移除人类数据后系统反而更强 [来源:podcast,当事人视角]
- David Silver "经验纪元"论:AI 应从自我生成的经验中学习,而非仅模仿人类 [来源:podcast,当事人视角]
- RLHF 是过渡方案——仍依赖人类偏好,限制了超人类突破 [来源:podcast,当事人视角]
- Meta-RL:让 RL 自己发现更好的 RL 算法,已超越人类设计的所有算法 [来源:podcast,当事人视角]
Layer 3: World Model
- Hassabis 反复强调当前 LLM 缺乏对物理世界的内在理解 [来源:podcast,当事人视角]
- Genie 项目:从单张图片生成可交互 3D 世界,学习物理规律 [来源:podcast,当事人视角]
- 作用:给 AI 一个"想象空间"来做心理模拟和规划
Layer 4: Planning & Search
- AlphaZero-on-LLMs 核心思路:将树搜索/规划能力叠加到 LLM 之上 [来源:podcast,当事人视角]
- 对标 OpenAI o1/o3 的 inference-time compute 路线 [来源:podcast,当事人视角]
- AlphaProof:形式化数学推理,展示 search + reasoning 结合的潜力 [来源:podcast,当事人视角]
Layer 5: Memory
- Project Astra 的记忆系统:10 分钟摄影记忆 + 跨 session 长期记忆 [来源:podcast,当事人视角]
- 灵感来源:Western scrub jay(缓食鸟)的情景记忆 [来源:podcast,当事人视角]
与竞争对手路线的对比
- OpenAI:更偏 Scaling Maximalism + Inference-time Compute(o1/o3),对 World Model / RL 投入少
- DeepMind:五层叠加路线,强调算法创新和 RL/Science 传统——"我们在下长棋" [来源:podcast,当事人视角]
- Anthropic:聚焦安全+产品,对 AGI 时间线更谨慎
与 tier1/2 的印证
- [多源印证] Hassabis "降维打击":通用模型能力进步 → 自然覆盖产品问题 → 与 AGI 信念一脉相承 [来源:tier2 合版访谈, tier2 语音PM访谈]
- [多源印证] DeepMind 合并的根本动机:AGI 需要 Google 的工程+算力资源 [来源:tier1 研究3, tier3 podcasts]
- AGI 安全与对齐的战略考量见 → ai-safety-alignment.md
待验证假设
- Layer 2-5 的叠加在实践中是否真能实现 1+1>2?还是各层之间存在冲突?
- "经验纪元"在开放世界(而非棋盘游戏)中是否可行?reward 定义是核心挑战
- DeepMind 的 RL/Science 传统是真正的路径优势,还是组织惯性?
🔗 相关节点
- Google DeepMind entity
- 全栈式 AI 创新战略 concept