Jeff Dean 实体

Google Chief Scientist / SVP，Google Brain 创始人之一，TPU 项目发起人。在 Google 工作 25+ 年，是 Google AI 技术路线的核心架构师。

核心角色

Google DeepMind Chief Scientist [来源：研究1]
Google Brain 共同创始人（2011，与 Andrew Ng）——从20%项目起步 [来源：深度分析，可验证]
TPU 项目的发起推动者（~2014），起因是具体算力危机："如果每个 Android 用户每天用3分钟语音识别，我们需要翻倍数据中心——'We need another Google'" [直接引语] [来源：深度分析，有引用支撑] [多源印证：前 TPU 工程师 Henry podcast]
MapReduce、TensorFlow 等多个基础设施项目的核心人物
Sanjay Ghemawat 是其传奇 coding 搭档，Google 内部最受尊敬的工程师之一 [来源：深度分析]

早期 AI 成就 [来源：深度分析，有引用支撑]

猫论文（2012）："Building High-level Features Using Large Scale Unsupervised Learning"——1000台机器/16000核训练的神经网络自主学出"猫"概念
AdSense 实现：借用 Noam Shazeer/George Herrick 的 PHIL 语言模型理解网页内容，一周写出 AdSense 实现——"because he was Jeff Dean" [来源：深度分析]
DNN Research 收购：亲自出马双倍 offer 挽留 Ilya Sutskever（阻止其加入 OpenAI）→ 被拒 [来源：深度分析]

技术远景 [来源：podcast，当事人视角]

MoE / Blob 架构

提出有机的、非规则的超大 MoE 模型远景（Pathways）
不同 expert 计算量差异 100-1000 倍，推理弹性 10,000-1,000,000 倍
模块化开发 + 蒸馏循环 = 持续学习
→ MoE / Blob 架构

训练目标变革

next-token prediction 不是最优——应让模型在 answer token 投入更多计算
应做更多数据增强（遮挡、反向等），类似视觉领域的 self-supervised learning

2030 推理算力需求

推理计算 50-1000x（inference-time scaling）× 用户渗透 100x × 模型增长 10-100x = 数个数量级增长
「需要极其高效的推理硬件」→ TPU 战略的核心理由

管理风格 [来源：podcast，当事人视角]

内部维护「Go Jeff Wacky Ideas」幻灯片，列出 17+ 个 crazy ideas
非命令式方向引导——让团队自由领取推进
主张 AI 安全的「Shaping」路线（非 laissez-faire，非 doom）
与 Noam Shazeer 在 Gradient Canopy（原 Charleston East 大楼）的 micro kitchen 办公

对 ChatGPT 失误的反思 [来源：podcast，当事人视角]

Google 内部有 Meena/LaMDA chatbot，比 ChatGPT 更早
核心失误：「没想到用户会用 chatbot 做非搜索的事」
搜索团队对 hallucination 和安全的高标准导致延迟发布

与其他实体关系

所在组织：Google DeepMind
推动的硬件：TPU 基础设施战略
与 Noam Shazeer 长期共事（Google Brain → Gemini）

🔗 相关节点

MoE / Blob 架构远景 concept
TPU 基础设施战略 concept