Google DeepMind (GDM) 实体
Google 的 AI 研究与模型研发中心,由 Google Brain 与 DeepMind 在23年合并而成,负责 Gemini 模型系列的全部研发。是一个 standalone company。
核心数据
总体规模
- DM 总人数:8000人 [来源:DM App访谈260302]
- Hassabis 直接管辖约 5600 人(2025年3月),合并时约 2500 人 [来源:媒体,已公开事实] [多源印证:与 tier2 260302 的 8000 人总数一致,5600 为 Hassabis 直接管辖]
- CEO:Demis Hassabis;Chief Scientist:Jeff Dean [来源:研究1]
- CTO / Chief AI Architect:Koray Kavukcuoglu(2025年6月起双线汇报 Pichai+Hassabis)[来源:媒体,已公开事实]
四大板块 [来源:DM App访谈260302, 260407]
| 板块 | 人数 | 职能 |
|---|
| Frontier AI | 2000 | 全部 researcher/research engineer,负责 Gemini model |
| GenAI | 4000 | Build infra 和模型 serving(如 TensorFlow framework) |
| Gemini App | 2000 | 应用开发 |
| 其他 | 几百 | 战略/product roadmap/milestone management |
Frontier AI 细节 [来源:DM App访谈260407]
- 研究天马行空的方向,按研究方向分组
- 示例组:4D投影(在拉斯维加斯 Sphere 做 4D 球形荧幕投影,仅约10人)、World Model、generative model 在 DNA 检测等科学前沿
- 主要在欧洲:两个 Leader Raia & Zoubin 在 London,Eng 在 Zurich 较多
GenAI 细节 [来源:DM App访谈260407]
- Generated Media 约300人:image 80人,video 100+人,其他还有 audio、3D、data eval
- 其他组:pre-training, post-training, eval, agent
- 也有一部分在欧洲;较大分支在 Mountain View(含产品团队)
模型训练人数 [多来源交叉]
- 参与模型训练:大几百人(每人有单独 code name)[来源:DM Post-train Security访谈260301]
- Pre-train + SFT + RL 占参与训练者的 10%,通用 post-train 占 90% [来源:DM Post-train Security访谈260301]
- Pre-train:小几百人 [来源:Collaborative访谈]
- Post-train:~2000 人,老大 Melvin Johnson(26年3月确定)[来源:Collaborative访谈]
- 基模后训练(文字+视频+图像):~200多人 [来源:多模态RL访谈]
- 真正能训 Flash 级模型的核心人员:100-200 人 [来源:合版访谈]
- 数据&评估团队:200+人(数据/评估各半),汇报给 Koray [来源:数据&评估访谈]
- Koray 团队总规模:从1000人扩至3000人(含模型服务、应用)[来源:数据&评估访谈]
- GenAI PM 团队:几十人,汇报给 PM VP David Thacker → Koray [来源:语音PM访谈]
- Flagship post-train ~100人(infra 50, data quality 10-20, RL, SFT)[来源:Gemini专家访谈260211]
- Frontier/AI Research post-train 各估计 20-30人 [来源:Gemini专家访谈260211]
创始使命与 AGI 信念
- 2010年 Shane Legg / Demis Hassabis / Mustafa Suleyman 创立 DeepMind,核心赌注:"AGI 在我们有生之年可以实现" [来源:podcast,Legg 当事人视角] [多源印证:深度分析]
- 使命从未改变:"Solve intelligence, then use it to solve everything else" [来源:podcast,Hassabis 当事人视角]
- AGI 时间线判断:Legg 预期 2028-2030,Hassabis "years not decades" [来源:podcast,当事人视角]
- Demis 创始定位:"不想在实现 AGI 之前做任何产品"——Larry Page 完全认同 [来源:深度分析,有引用支撑]
- → agi-path.md
创始与收购的完整故事 [来源:深度分析,有引用支撑]
- 种子轮:Demis 在 Singularity Summit 通过与 Peter Thiel 下棋建立关系 → Founders Fund 领投 ~$2M
- Elon Musk 投资:Demis 向 Musk 指出"即使去了火星,AI 出问题也能追到那里" → Musk 改变世界观成为投资人 [直接引语]
- Facebook 竞购:Zuckerberg 出价高达 $800M,但不允许 Demis 保持控制权
- Elon 竞购:试图用 Tesla 股票收购,想让 DM 做自动驾驶 → DM 拒绝
- Larry Page 发现 DM:Elon + Luke Nosek 在私人飞机上看 Atari Breakout AI 视频,Larry 也在飞机上 → "What are you watching? What company is this?"
- Google 收购 $550M(低于 Facebook 出价),关键条款:DeepMind 独立监督董事会
- Geoff Hinton 尽职调查:因背部问题无法坐飞机,Alan Eustace 包机+设计专用安全带(Eustace 曾创高空跳伞世界纪录)
- 最深远影响:收购直接引发 Elon → OpenAI → ChatGPT → Anthropic 的连锁反应 [→ chatgpt.md]
关键人物(tier3 podcast 新增)
| 人物 | 职位 | 角色 | 来源 |
|---|
| David Silver | Principal Research Scientist | AlphaGo/AlphaZero 核心创造者,"经验纪元"提出者 | podcast |
| Anca Dragan | VP Research / Safety Lead | AI Safety & Alignment 负责人,Waymo 背景 | podcast |
| Pushmeet Kohli | VP Research | AI for Science 负责人,AlphaFold/GNoME/GraphCast | podcast |
| Greg Wayne | Director in Research | Project Astra 负责人,神经科学背景 | podcast |
| Tim Rocktäschel | Research Scientist | Genie (World Model) Lead | podcast |
| Murray Shanahan | Senior Research Scientist | 认知机器人/AI 哲学专家 | podcast |
| Ted Xiao | Research Scientist | 机器人(RT-2/RT-X)方向 | podcast |
| Nicklas Lundblad | Head of Public Policy | AI 政策/监管 | podcast |
历史
- Google Brain(2011-2023):Andrew Ng & Jeff Dean 共同创立(从20%项目起步),侧重工程+基础设施,开发 TensorFlow 和 Transformer 架构,代表模型 BERT/LaMDA/PaLM [来源:研究1] [多源印证:深度分析]
- 2012年"猫论文":1000台机器训练的神经网络从1000万 YouTube 帧自主学出"猫"概念——Astro Teller 后来表示 Brain 对核心业务的增益超过 Google 所有其他 moonshot 投资总和 [来源:深度分析,有引用支撑]
- 2017年 Transformer:八人发表 "Attention Is All You Need",被引 173,000+ 次(21世纪第七),Noam Shazeer 从零重写代码库是质变转折点——八位作者后来全部离开 Google [来源:深度分析,有引用支撑] [多源印证:公开事实]
- DeepMind(2014收购-2023):Demis Hassabis 创立,侧重 AGI 和科学探索,代表 AlphaGo/AlphaFold/Chinchilla(Scaling Law)[来源:研究1]
- 合并前的对立:Brain 总部 Mountain View、DeepMind 总部 London King's Cross;DeepMind 刻意避开 Brain 所在城市开设办公室(Paris、Edmonton);DeepMind 可访问 Brain 代码,反之不行 [来源:媒体,已公开事实]
- Project Mario:Hassabis 曾推进将 DeepMind IP 独立为单独公司,2021年 Pichai 承诺追加资金后终止 [来源:媒体,已公开事实]
- 合并(23年4月):面对 ChatGPT 冲击——Sundar code red,Brain 有 chatbot 比 ChatGPT 早但因搜索团队高标准延迟发布——双轨制研发资源分散成为劣势,合并为 GDM [来源:研究1] [多源印证:媒体报道, 深度分析]
- 合并违反了原始收购条款(独立监督董事会),但被视为必要的战时决策 [来源:深度分析]
- 同时确立全公司统一 Gemini 模型——理性经济:scaling law 决定最大模型最好,维护多模型翻倍成本 [来源:深度分析]
- 合并后缩减非关键研究项目:Gato 续作、GenRL 团队等 [来源:媒体,已公开事实]
- Hassabis 对合并的评价:获得世界级工程能力和分发渠道,同时保持研究独立性——务实而正面 [来源:podcast,当事人视角]
- 但 Hassabis 曾考虑离开 Google 另起实验室(合并前后),最终选择留下 [来源:媒体——Google 发言人否认]
组织结构 [来源:研究3, 多份tier2访谈]
- 矩阵式组织:按职能(Researcher / Research Engineer / TPM)× 按任务(Pre-train / Post-train)
- Post-train 按能力划分为 200+ 个 ~10 人小组:Reasoning / Instruction Following / 数学 / Tool Call / Coding(最大)/ 审美 / 协作(Model Behavior)等 [来源:Collaborative访谈]
- Verifiable vs. Unverifiable 两大分支——Verifiable(Coding/Math)好出成果人最多,Unverifiable(Writing/Collaborative/Proactive)Pure Research 但直接影响留存 [来源:Collaborative访谈]
- "One Launch Thing" 合版团队(30-40人):对所有 Gemini Model 最终效果负责 [来源:合版访谈]
- Coordination Team:管理所有 post-train 小组,防止 Reward Hacking,做全局 trade-off [来源:研究3]
- User Signal Team:跨 GenAI/Gemini App/Search 收集用户反馈,Post-train 团队需 Address 后才能 Release [来源:Collaborative访谈]
- GenAI PM 团队:几十人,定义模型 Capability,看 Horizontal 能力(全 Google 家族)[来源:语音PM访谈]
- FAI(Frontier AI)团队:纯研究,比较独立,压力小,可发 Paper [来源:Collaborative访谈]
- Engineer/TPM:解决「基础模型外、各应用通用的」中间层问题(如反蒸馏防御),也作为产品需求传递层
Gemini 模型分 3 个团队 [来源:Gemini专家访谈260211]
| 团队 | 定位 | Post-train 规模 |
|---|
| Flagship | 当前模型 | ~100人(infra 50, data quality 10-20, RL, SFT) |
| Frontier | 4.3/下一代模型 | 估计 20-30人 |
| AI Research | 更前沿模型 | 估计 20-30人 |
- Level 高的人会 cross 团队(部分时间做 Flagship、部分做 Frontier)
安全与保密
- DM 与 Google 其他 org 非常独立,管理严格 [来源:DM Post-train Security访谈260301]
- Google 每栋楼可进,DM 只有自己人能进
- 代码完全保密
- 跨 org 转组至 DM 比较常见(search/广告转来),各团队都想往 DM 挤 [来源:DM Post-train Security访谈260301]
- DeepMind 在内部属于"高攀不上的地方" [来源:DM App访谈260407]
算力资源分配 [来源:DM App访谈260407]
- Allocator:DM 高层决定,1-2 个 Director level 以上(L7-8)TPGM
- GenAI Leader:Abby Len(Mountain View)负责 resource allocation [人名可能为音译不准确]
- 流程:月度 allocation → 各组在 tool 上 make a case → leader review → 重要项目可能需 face-to-face explain
- 优先级:大 project(如 Gemini 4 pre-training)最高 → TPGM 和 SWE 估算 TPU 数量和时间 → 分配;小 project(如小 OEM backend)优先级极低
- Gemini 手机 OEM 体量排名:Pixel 和 Samsung 最大,其他都很低
- → tpu-infrastructure-strategy.md
与产品的协作模式 [来源:研究3, 多份tier2访谈]
- 绝对主导:Foundation model 由 GDM 说了算。"谁有卡,谁有话语权" [来源:Collaborative访谈]
- 核心思路:通用模型能力进步 →「降维打击」产品问题。Demis 坚信 AGI 很快到来,fine-tuning 当前模型时下一代可能已原生解决 [来源:语音PM访谈]
- 业务团队只能做 Prompt Engineering:所有 fine-tune 权限收回。Gemini App 不再被允许私自训练模型,只能在 Harness 层做 Personality/Memory 调整 [来源:语音PM访谈, 合版访谈]
- 产品端需求可以不理会:PM 反馈太 Noisy/Sparse,Reddit 吐槽甚至更有用 [来源:Collaborative访谈]
- GenAI PM 作为 Bridge:业务方 PM/工程师经常无法与模型团队技术交流——分不清 pipeline 问题还是 fundamental model 局限 [来源:语音PM访谈]
- 顶层对齐:每年初与各 PA VP 级规划会议
- 日常模式:「模型能力跑很快,产品看有什么就用什么」
- API-only post-train:不提供 checkpoint,产品团队只能基于 API 做 post-train
- 特殊定制:Gemini Nano(端侧)、Samsung post-train
25-26年关键变化
- 2024年3月:Pushmeet Kohli, Raia Hadsell, Zoubin Ghahramani 从 Koray 直接改向 Hassabis 汇报;Koray 获 CTO 头衔 [来源:媒体,已公开事实]
- 2024年4月:设立 "Product Impact" 组(VP Chandu Thota 领导)→ 2025年3月被 Hassabis 解散 [来源:媒体,已公开事实]
- Gemini chatbot 产品/工程与 Project Astra 合并,由 Sissie Hsiao(Sissie)统管 [来源:媒体,已公开事实]
- Chatbot 专用 base model 团队合入主模型团队 "One Recipe" [来源:媒体,已公开事实] [多源印证:与 tier2 合版访谈中 One Recipe 描述一致]
- 2025年6月:Koray 晋升 Chief AI Architect,双线汇报 Pichai+Hassabis,统一全公司模型训练;Hassabis 转向长期研究 [来源:媒体,已公开事实]
- 约 200 名 Search 内 Gemini 训练员工并入 Koray 组织 [来源:媒体,已公开事实]
- 25年8-9月:Search 几十人 post-train/eval 并入 GDM [来源:研究3]
- 26年3月:Melvin Johnson 确定负责整个 Post-training 方向 [来源:Collaborative访谈]
- Gemini App 负责人更换:Josh Woodward(前 Google Labs)接替 Sissie Hsiao,同时管 Labs 和 Gemini App [来源:语音PM访谈]
- Coding 从"补短板"升级为核心优先级——受访者入职1.5年来一直推动 coding 预训练 [来源:数据&评估访谈]
- 结果:AIO/AIM answer 质量提升,Google 在「长 query」的用户心智有提升 [来源:研究3]
管理文化
- Koray 管理风格:极度结果导向(impact + execution),不重视繁文缛节,保持创业公司感觉 [来源:数据&评估访谈]
- 晋升极简:材料限250字,背书30秒-5分钟 [来源:数据&评估访谈]
- 工作强度:每周 50-70 小时,与 xAI 差不多 [来源:Collaborative访谈, 多模态RL访谈]
- GDM 被戏称 AI"黄埔军校":人才流失严重——练好出一拨人创业 [来源:Collaborative访谈]
- 内部氛围:比 Meta(固定比例裁员)和 xAI 更稳定,但压力大。比较像 Startup [来源:Collaborative访谈]
- 20% 自主探索文化已消亡:Google 以前允许员工用1天做 OKR 无关的事(Gmail 即由此诞生),目前 DeepMind 已无人这么做,其他 org 也少 [来源:DM App访谈260407]
- 23年大型 lay-off:9-10%,走了1万+人,后续有持续 lay-off 但无 public announcement——历史上唯一一次大型 lay-off。可能原因:cost saving + AI 投入 + 部分高薪低产员工 [来源:DM App访谈260407]
AI for Science 项目矩阵 [来源:podcast,当事人视角]
- AlphaFold 2/3(蛋白质结构,诺贝尔化学奖)
- GNoME(材料发现,220 万种新材料)
- GraphCast/GenCast(天气预测,超越超算)
- AlphaProof(形式化数学推理)
- Genie 1/2/3(World Model,可交互 3D 世界生成)
- → ai-for-science-strategy.md
领导层视角(来自 tier3 podcasts)
Demis Hassabis [来源:podcast,当事人视角]
- AGI 时间线:5-10 年,定义包括科学发现 + robotics
- 研发策略:50% scaling + 50% innovation = 「all-court press」
- 文化转型:从研究机构 → 「startup 式出货机器」+ shipping culture
- 个人核心热情:world models + simulations + consciousness
- 「my job is to make sure we win no matter what happens」(不管 bubble 是否破裂)
- 正在组建 post-AGI 团队(Shane Legg 领导)
Jeff Dean [来源:podcast,当事人视角]
- 技术远景:MoE → 有机 Blob 架构(Pathways),模块化开发和持续学习
- 2030 推理算力:数个数量级增长
- 管理方式:「Go Jeff Wacky Ideas」幻灯片,非命令式引导
- 反思:Google 内部有 chatbot 比 ChatGPT 早,但因搜索视角的高标准而延迟发布
Koray Kavukcuoglu [来源:podcast,当事人视角]
- AGI = 五维系统工程(推理/工具使用/多模态/持续学习/可靠性)
- Google 端到端验证闭环是核心优势
- 文化核心:impact + intellectual honesty > paper 数量
- 团队从 1000 → 3000 人
Google Brain → Gemini 的文化转型 [来源:podcast,Jeff Dean & Noam,当事人视角]
- Brain 时代:bottom-up UBI 式算力分配,每人一 credit 投票
- Gemini 时代:top-down 集中管理——协作增强但激励变形
- 未来需要混合模式
- [多源印证:与 tier2 DM App 访谈 260407 关于「20% 自主探索已消亡」一致]
与其他实体关系