MoE / Blob 架构远景 (MoE / Blob Architecture Vision) 概念

定义

Jeff Dean 提出的下一代模型架构远景:从当前结构化的 Mixture of Experts 演进为「有机的、非规则的、不断生长的 Blob」——不同 expert 计算量差异 100-1000 倍,可独立开发和热插拔,连接密度自适应硬件拓扑。这是 Pathways 系统设计的目标方向。

机制拆解

当前 MoE 的局限 [来源:podcast,当事人视角]

Blob 架构的核心特征 [来源:podcast,Jeff Dean,当事人视角]

  1. Variable cost experts:不同 expert 计算量差异 100-1000 倍
  2. 可变深度路径:math 方向可能跨很多层,简单 query 可能用 skip connection
  3. 推理计算弹性:easy task vs. hard task 投入计算差距 10,000-1,000,000 倍
  4. 模块化开发:100 个团队并行开发(东南亚语言 / Haskell 推理 / 数学 expert),开发完热插拔
  5. 持续学习引擎:大版本 → 蒸馏小版本 → 删除大版本 → 增加容量继续学 → 循环
  6. 硬件拓扑自适应:同芯片密集连接,跨芯片少些,跨 Pod 更少,跨 metro 最少——让结构有机 emerge
  7. 数据控制模块化:个人数据模块 / YouTube 专用模块 / 公司内部数据模块——数据访问权限通过模块隔离

研发效率革命

推理侧部署

实现状态

与其他概念关系

⚠️ 注意:Blob 架构目前是 Jeff Dean 的个人远景,尚未在产品级模型中验证。但 Pathways 基础设施已在建设中。

🔗 相关节点