数据即模型 (Data Is The Model) 概念

定义

在预训练进入 overtrain 时代、post-train 以 RL 为核心范式的背景下,数据的质量、选取和 taste 已成为模型能力的决定性因素,超越算法创新和模型架构本身。多位 DeepMind 受访者在不同访谈中独立印证了这一判断。

机制拆解

预训练:Overtrain 范式

Post-train:数据 > 算法

Taste 是核心能力

数据供给挑战

数据支撑

与其他概念关系

待验证假设

🔗 相关节点