Meta豪掷600亿布局AI,DeepSeek低成本高效能模型引质疑

   发布时间:2025-01-28 11:42 作者:江紫萱

据最新消息,尽管中国人工智能(AI)初创企业DeepSeek推出了极具成本效益的模型,引发业界对AI技术巨额投入的质疑声浪,但meta Platforms, Inc.仍计划在2025年维持其烧钱速度。

上周五,meta首席执行官马克·扎克伯格在Facebook上发帖宣布,尽管面临AI领域的激烈竞争,meta仍计划在2025年投入600亿至650亿美元用于资本支出(Capex),以加速AI开发。这一计划远超华尔街预测的今年513亿美元的Capex,与分析师预期的约380亿美元的年度Capex相比,增长了近58%,更是2023年的两倍多。

扎克伯格将2025年称为“AI的决定性一年”,并期望meta AI能成为服务超过十亿人的领先助手,开源模型Llama 4能成为最先进的领先模型,同时推出一位AI工程师,为公司的研发工作贡献越来越多的代码。

为了实现上述目标,meta正在建设一个2吉瓦(GW)以上的数据中心,其规模将覆盖曼哈顿的很大一部分。扎克伯格表示,该数据中心将在2025年上线1吉瓦的计算能力,并在年底前拥有超过130万个图形处理单元(GPUs)。

除了2025年高达650亿美元的Capex计划外,扎克伯格还表示,meta将在今年大幅扩大其AI团队,并强调公司有资金在未来几年继续投资。

然而,尽管meta有着雄心勃勃的支出计划,但据报道,面对DeepSeek带来的新挑战,meta已陷入恐慌模式。DeepSeek的AI模型以极低的成本实现了与领先产品相当的性能。据《The Information》周末报道,meta的AI团队领导层,包括AI基础设施总监马修·奥尔德姆,最近都担心DeepSeek的新AI意味着meta在AI竞赛中正在落后。这些领导层担心,meta即将在本季度发布的下一代旗舰AI Llama的表现将不如DeepSeek的模型。据《The Information》引用的两位meta员工称,meta已成立了多个“作战室”或专业研究小组,以剖析DeepSeek并利用其见解改进Llama。

据报道,meta的生成式AI团队和基础设施团队已开始设立四个作战室,以学习DeepSeek的工作原理。其中两个作战室试图了解DeepSeek的创始人和支持者High-Flyer如何降低其训练和运行成本,因为meta希望将这些技术应用于Llama。第三个作战室试图弄清楚High-Flyer可能使用了哪些数据来训练DeepSeek模型,而第四个作战室则正在权衡基于DeepSeek同类模型属性重构meta模型的新技术。

在职业人士寻求和分享建议的匿名论坛式社交媒体应用Team Blind上,一篇帖子也反映了meta内部的恐慌模式。一位meta员工在帖子中表示,DeepSeek的V3模型在整个生成式AI团队中引发了恐慌模式,而这家“拥有550万训练预算的未知中国公司”更是雪上加霜。

“工程师们正在疯狂地剖析DeepSeek,并尽可能地从中学习一切。我一点都没有夸张,”这位员工说,“管理层担心如何为生成式AI组织的巨额成本辩护。当生成式AI组织的每一位‘领导’的薪水都超过了训练DeepSeek V3的全部成本,而我们又有数十位这样的‘领导’时,他们该如何向高层交代呢?”

 
 
更多>同类内容
全站最新
热门内容
本栏最新