近期,一则关于“H100 GPU租赁价格骤降至2美元/小时”的报道在国内引发了广泛关注。据报道,英伟达H100 GPU自2023年3月上市后,因需求激增一度供不应求,租赁价格从4.7美元/小时飙升至8美元/小时以上。然而,今年以来,H100市场出现“供过于求”现象,租赁价格大幅下跌至2美元左右。
价格下跌的原因多样:部分公司完成模型训练后转售闲置算力;许多企业转而微调开放模型,降低了算力需求;新创公司专注于构建大规模基础模型的数量减少;以及H100替代品的出现,如AMD和英特尔的GPU。
追溯报道源头发现,海外主流媒体及主要科技媒体尚未进行相关报道。原报道《$2 H100s: How the GPU Bubble Burst》出自Latent Space网站,作者为Eugene Cheah。Latent Space是一个聚焦于AI的内容讯息、博客、社区平台,由swyx及Alessio Fanelli主持,后者为早期风投公司Decibel VC的合伙人和CTO。
Eugene Cheah是初创公司Featherless.Ai的CEO。据其介绍,Featherless.Ai目前托管着全球最大的开源AI模型,提供每月10美元起的无限制请求服务。
报道中配有一幅法国艺术家让-莱昂•热罗姆1882年创作的油画《郁金香狂热》,描绘了17世纪荷兰的“郁金香狂热”投机泡沫。这一历史事件是否会在AI领域重演,牵动着每一位AI投资者的心,也是此次报道引发关注的原因之一。
从算力租赁商Vast.ai的报价来看,1x H100的一小时租赁价格确实已降至2~3美元区间。
然而,H100租赁价格下跌是否真的意味着“GPU泡沫破灭”呢?一方面,Eugene Cheah指出,“H100价格下跌”更适用于“分化”这一描述,主要集中在小规模集群的租赁价格,而大规模算力集群的价格可能维持在较高水平。
另一方面,电子产品具有更新迭代周期,GPU芯片也不例外。尽管英伟达下一代GPU Blackwell系列曾传出设计缺陷,但摩根士丹利报告称,Blackwell的生产正在“按计划进行”,且未来12个月左右的供应已经售罄。这意味着现在下订单的客户要到2025年底才能收到货,将继续推动对现有Hopper架构产品的短期需求。
H100租赁价格的波动并非骤然暴跌,而是已有时日。从A100到H100,再到未来的Blackwell,新品出世势必带来前代产品的没落。英伟达CEO黄仁勋也表示,英伟达的持续看涨与互联网泡沫顶峰时期围绕思科的狂热完全不同。他认为,未来将是“高度机器学习”的时代。
“摩尔定律已经基本宣告终结”,黄仁勋表示,为了提供必要的算力以跟上未来计算密集型软件的步伐,未来4~5年内,现有数据中心将需要价值约1万亿美元的GPU来实现升级。
必须承认的是,“AI泡沫”论的警钟频敲,“AI投资回报难达预期”的质疑声音此起彼伏。一边是OpenAI抱怨算力上线不及时不够用、英伟达新品售罄,另一边是算力租赁价格不断下降、还有公司“甩卖”GPU。然而,局部的、短期的算力过剩或短缺,似乎已难以代表AI的全盘局面。