Meta豪掷600亿布局AI，DeepSeek低成本高效能模型引质疑

发布时间：2025-01-28 11:42 来源：钛媒体APP 作者：江紫萱

据最新消息，尽管中国人工智能（AI）初创企业DeepSeek推出了极具成本效益的模型，引发业界对AI技术巨额投入的质疑声浪，但meta Platforms, Inc.仍计划在2025年维持其烧钱速度。

上周五，meta首席执行官马克·扎克伯格在Facebook上发帖宣布，尽管面临AI领域的激烈竞争，meta仍计划在2025年投入600亿至650亿美元用于资本支出（Capex），以加速AI开发。这一计划远超华尔街预测的今年513亿美元的Capex，与分析师预期的约380亿美元的年度Capex相比，增长了近58%，更是2023年的两倍多。

扎克伯格将2025年称为“AI的决定性一年”，并期望meta AI能成为服务超过十亿人的领先助手，开源模型Llama 4能成为最先进的领先模型，同时推出一位AI工程师，为公司的研发工作贡献越来越多的代码。

为了实现上述目标，meta正在建设一个2吉瓦（GW）以上的数据中心，其规模将覆盖曼哈顿的很大一部分。扎克伯格表示，该数据中心将在2025年上线1吉瓦的计算能力，并在年底前拥有超过130万个图形处理单元（GPUs）。

除了2025年高达650亿美元的Capex计划外，扎克伯格还表示，meta将在今年大幅扩大其AI团队，并强调公司有资金在未来几年继续投资。

然而，尽管meta有着雄心勃勃的支出计划，但据报道，面对DeepSeek带来的新挑战，meta已陷入恐慌模式。DeepSeek的AI模型以极低的成本实现了与领先产品相当的性能。据《The Information》周末报道，meta的AI团队领导层，包括AI基础设施总监马修·奥尔德姆，最近都担心DeepSeek的新AI意味着meta在AI竞赛中正在落后。这些领导层担心，meta即将在本季度发布的下一代旗舰AI Llama的表现将不如DeepSeek的模型。据《The Information》引用的两位meta员工称，meta已成立了多个“作战室”或专业研究小组，以剖析DeepSeek并利用其见解改进Llama。

据报道，meta的生成式AI团队和基础设施团队已开始设立四个作战室，以学习DeepSeek的工作原理。其中两个作战室试图了解DeepSeek的创始人和支持者High-Flyer如何降低其训练和运行成本，因为meta希望将这些技术应用于Llama。第三个作战室试图弄清楚High-Flyer可能使用了哪些数据来训练DeepSeek模型，而第四个作战室则正在权衡基于DeepSeek同类模型属性重构meta模型的新技术。

在职业人士寻求和分享建议的匿名论坛式社交媒体应用Team Blind上，一篇帖子也反映了meta内部的恐慌模式。一位meta员工在帖子中表示，DeepSeek的V3模型在整个生成式AI团队中引发了恐慌模式，而这家“拥有550万训练预算的未知中国公司”更是雪上加霜。

“工程师们正在疯狂地剖析DeepSeek，并尽可能地从中学习一切。我一点都没有夸张，”这位员工说，“管理层担心如何为生成式AI组织的巨额成本辩护。当生成式AI组织的每一位‘领导’的薪水都超过了训练DeepSeek V3的全部成本，而我们又有数十位这样的‘领导’时，他们该如何向高层交代呢？”

更多>同类内容