AGI 路径 (Path to AGI) 概念

定义

DeepMind 对 AGI（通用人工智能）的定义、时间线判断和技术路径。这是 DeepMind 所有战略决策的北极星——Hassabis/Legg/Silver 等创始团队从 2010 年起就以 AGI 为终极目标。

AGI 定义

Shane Legg 定义：在绝大多数经济上有价值的认知任务上达到或超越人类专家水平 [来源：podcast，当事人视角]
Hassabis 补充：不仅是模仿人类，更是能发现人类不知道的新知识（Move 37 标准）[来源：podcast，当事人视角]

时间线判断

来源	判断	置信度
Shane Legg（Co-founder）	2028-2030	明确给出时间窗口 [来源：podcast，当事人视角]
Demis Hassabis（CEO）	"Years, not decades"	比 Legg 稍谨慎但方向一致 [来源：podcast，当事人视角]
Anca Dragan（Safety Lead）	比之前认为的更快	10年前觉得有充足时间，现在感到紧迫 [来源：podcast，当事人视角]
Oriol Vinyals（Gemini Co-Lead）	暗示 Agentic AI 是通往 AGI 的中间里程碑	[来源：podcast，当事人视角]

技术路径：五层叠加模型

Hassabis 在多次访谈中阐述的 AGI 路线图可归纳为五层叠加：

Layer 5: Memory（长期记忆与持续学习）
Layer 4: Planning & Search（树搜索 + 多步推理）
Layer 3: World Model（物理世界内在理解）
Layer 2: RL / Self-play（超越人类数据天花板）
Layer 1: LLM Pre-training（压缩世界知识的基座）

[来源：podcast，当事人视角，综合 Hassabis/Legg/Silver/Vinyals 多次论述]

Layer 1: LLM 基座

预训练吸收人类全部知识 → 强大的语言/推理/知识基础
但有"人类数据天花板"——Silver 认为这是根本局限 [来源：podcast，当事人视角]

Layer 2: RL / Self-play

AlphaZero 证明了关键原理：移除人类数据后系统反而更强 [来源：podcast，当事人视角]
David Silver "经验纪元"论：AI 应从自我生成的经验中学习，而非仅模仿人类 [来源：podcast，当事人视角]
RLHF 是过渡方案——仍依赖人类偏好，限制了超人类突破 [来源：podcast，当事人视角]
Meta-RL：让 RL 自己发现更好的 RL 算法，已超越人类设计的所有算法 [来源：podcast，当事人视角]

Layer 3: World Model

Hassabis 反复强调当前 LLM 缺乏对物理世界的内在理解 [来源：podcast，当事人视角]
Genie 项目：从单张图片生成可交互 3D 世界，学习物理规律 [来源：podcast，当事人视角]
作用：给 AI 一个"想象空间"来做心理模拟和规划

Layer 4: Planning & Search

AlphaZero-on-LLMs 核心思路：将树搜索/规划能力叠加到 LLM 之上 [来源：podcast，当事人视角]
对标 OpenAI o1/o3 的 inference-time compute 路线 [来源：podcast，当事人视角]
AlphaProof：形式化数学推理，展示 search + reasoning 结合的潜力 [来源：podcast，当事人视角]

Layer 5: Memory

Project Astra 的记忆系统：10 分钟摄影记忆 + 跨 session 长期记忆 [来源：podcast，当事人视角]
灵感来源：Western scrub jay（缓食鸟）的情景记忆 [来源：podcast，当事人视角]

与竞争对手路线的对比

OpenAI：更偏 Scaling Maximalism + Inference-time Compute（o1/o3），对 World Model / RL 投入少
DeepMind：五层叠加路线，强调算法创新和 RL/Science 传统——"我们在下长棋" [来源：podcast，当事人视角]
Anthropic：聚焦安全+产品，对 AGI 时间线更谨慎

与 tier1/2 的印证

[多源印证] Hassabis "降维打击"：通用模型能力进步 → 自然覆盖产品问题 → 与 AGI 信念一脉相承 [来源：tier2 合版访谈, tier2 语音PM访谈]
[多源印证] DeepMind 合并的根本动机：AGI 需要 Google 的工程+算力资源 [来源：tier1 研究3, tier3 podcasts]
AGI 安全与对齐的战略考量见 → ai-safety-alignment.md

待验证假设

Layer 2-5 的叠加在实践中是否真能实现 1+1>2？还是各层之间存在冲突？
"经验纪元"在开放世界（而非棋盘游戏）中是否可行？reward 定义是核心挑战
DeepMind 的 RL/Science 传统是真正的路径优势，还是组织惯性？

🔗 相关节点

Google DeepMind entity
全栈式 AI 创新战略 concept