AI 安全与对齐 (AI Safety & Alignment) 概念

定义

DeepMind 的 AI 安全战略——"安全必须内建于设计"(safe bridge 原则),覆盖当前危害防控到长期 AGI 风险。

核心原则

"造桥"原则(Dragan / Hassabis 共识)

安全 ≠ 减速

关键挑战

1. 对齐到谁?(Whose values?)

2. 欺骗性 AI (Deceptive AI / Sycophancy)

3. AI Ethics vs. Existential Risk 的融合

组织架构

与竞争对手对比

维度DeepMindOpenAIAnthropic
安全路线内建设计 + 两头覆盖Scaling → 安全安全优先(Constitutional AI)
核心人物Legg + Dragan核心安全团队大规模离职Dario/Daniela Amodei
公开立场谨慎但坚定加速为主谨慎优先

待验证假设

🔗 相关节点