周一,英伟达公司(Nvidia Corporation)股价遭遇重创,收盘时大幅下跌约16.9%,创下了自2020年3月16日以来的最差单日表现。伴随股价暴跌,英伟达市值蒸发近6000亿美元,打破了这家人工智能(AI)芯片巨头去年9月创下的美国上市公司市值单日跌幅最大纪录。
此次股市动荡源于中国AI初创企业DeepSeek带来的冲击,令美国AI相关股票遭遇了一场“血洗”。本周末,DeepSeek的移动应用在应用商店中迅速攀升至榜首,取代了OpenAI的ChatGPT,成为苹果App Store上美国最受欢迎的免费应用。据移动应用分析公司Appfigures数据显示,周一,DeepSeek在iOS平台的美国App Store以及另外51个国家的应用商店中均位列免费应用第一。
DeepSeek的AI模型上周末在美国社交媒体平台X上迅速走红,随后其在应用商店的排名也水涨船高。令人震惊的是,DeepSeek仅花费了558万美元就训练出了其V3大型语言模型(LLM)。该初创公司声称,他们使用了2048个英伟达H800芯片,这是英伟达H100芯片的降级版本,旨在遵守美国的出口限制。DeepSeek仅用260万H800小时就训练出了一个远超meta模型的LLM,而meta使用其Llama 3模型家族的预算,本可以至少训练15次DeepSeek-V3。
本月早些时候,DeepSeek发布了其开源推理模型DeepSeek-R1,声称其性能可与OpenAI的o1等领先产品相媲美,但成本却低得多。多项第三方测试发现,DeepSeek的实际表现甚至超过了OpenAI的最新模型。R1包含6710亿个参数,其“蒸馏”版本的参数范围从15亿到700亿不等。通过DeepSeek的API,完整版的R1价格比o1便宜90%-95%。
知名投资者马克·安德森(Marc Andreessen)周五在社交媒体平台X上表示:“DeepSeek的推理模型是我见过的最令人惊叹和印象深刻的突破之一,而且作为开源产品,它是给世界的一份深刻礼物。”安德森是硅谷知名风险投资公司Andreessen Horowitz的负责人,他将R1比作“AI的斯普特尼克时刻”,指的是1957年苏联发射第一颗人造地球卫星,从而引发了太空竞赛。
Hugging Face平台的开发者们已经创建了500多个R1的衍生模型,这些模型的总下载量达到了250万次,是官方R1下载量的五倍,该平台CEO克莱姆·德朗(Clem Delangue)在社交媒体平台X上的一篇帖子中说道。
英伟达的一位发言人表示,DeepSeek是“一项出色的AI进步”。这位发言人在周一接受CNBC采访时表示:“DeepSeek的工作展示了如何使用这种技术创建新模型,利用广泛可用的模型和完全符合出口管制要求的计算能力。”
路透社援引英伟达的评论称,DeepSeek的推理需要大量英伟达图形处理器(GPU)和高性能网络的支持。英伟达还强调,DeepSeek使用的是为中国市场设计的经批准的GPU版本,以反驳有关潜在出口违规的指控。
经纪公司杰富瑞评论称,DeepSeek在AI训练方面的能效对上周Stargate和meta做出的重大承诺所引发的资本支出热潮造成了一定打击。鉴于DeepSeek的性能可与GPT-4o相媲美,但计算能力却低得多,杰富瑞认为,这对于AI建设者来说可能产生潜在的负面影响,因为AI企业面临越来越大的压力来证明其不断增加的资本支出计划是合理的,这最终可能导致数据中心收入和利润增长的轨迹降低。
然而,花旗集团对这一观点表示质疑,认为DeepSeek的成就并非没有使用先进的GPU进行微调或构建最终模型所基于的底层LLM(通过蒸馏技术)。花旗集团预计,领先的AI公司不会放弃使用更先进的GPU,因为它们在大规模上提供了更具吸引力的美元/TFLOPs(每秒万亿次浮点运算)性能。