自主化智算,算力荒后新挑战:建设未完,加速还是放缓?

   发布时间:2024-12-21 18:16 作者:杨凌霄

在2023年,全球范围内掀起了一股大炼模型的浪潮,算力需求急剧上升,一度导致了算力市场的供不应求,高端显卡更是成为了稀缺资源。为了应对这一挑战,各地纷纷加速数据中心和智算中心的建设,力求解决国产大模型的算力瓶颈。

然而,时过境迁,今年的算力市场却呈现出截然不同的景象。曾经一卡难求的高端显卡,如今却面临着滞销的困境,“GPU倒爷”们的朋友圈里充满了求售的信息。同时,算力租赁市场的上架率也远低于理想水平,大量投入资金建设的算力资源处于闲置状态。

面对这一变化,市场上出现了算力荒已经缓解,甚至供过于求的声音,有人开始质疑自主化智算建设的必要性,认为智算中心的建设已经过剩。那么,事实真的如此吗?

回顾2023年算力短缺的焦虑时期,倪光南院士曾发出过警示,担心各地盲目建设低水平的智算中心,最终可能变成“技术房地产”和“数字烂尾楼”。如今,算力从短缺到过剩的转变,确实让人深思。闲置的算力主要集中在三个方面:一是价格昂贵,中小企业难以承受;二是国产算力卡组成的集群在协同调度上存在问题,不好用;三是随着“百模大战”的结束,训练算力的需求减少,而推理算力的需求尚未大规模爆发。

尽管如此,我们仍然不能忽视自主化智算建设的重要性。从长期来看,国内智算基础仍然薄弱,与美国的差距仍然显著。美国自20世纪90年代以来就在IT建设上大力投入,而国内智算虽然近年来发展迅速,但仍在积极补课。如果此时停止建设,不仅会前功尽弃,还会进一步拉大中美在AI基础设施上的差距。

从近期来看,自主化AI算力的需求仍然没有得到充分满足。一方面,海外AI算力进口受到限制,存在供应链安全风险。另一方面,随着大模型规模法则的继续,以及基础模型市场集中度的提高和能力提升,AI应用需求将进一步释放,对推理算力的需求也将爆发。因此,国产AI算力荒并未解决,反而需要从现在开始重视和应对。

那么,如何合理地推进自主化智算的建设呢?这已经成为了一个真问题。国内智算产业已经来到了承上启下的新阶段,不仅要追求智算中心的“建起来”,还要能运营好、用起来。智算厂商的竞争也从硬件资源和解决方案的售卖,转变为多维度、综合性、长期服务的竞争。

为了解决自主化AI算力的痛点问题,智算厂商们正在集中力量攻克异构问题、算效问题和运营问题。例如,通过提供系统平台来屏蔽底层异构硬件的复杂性,提高国产算卡的使用效率;通过软硬件系统的无缝配合,充分释放国产算卡的性能;以及通过提供设计、使用、运营等一体化服务,避免智算中心成为“数字烂尾楼”。

回顾这一年多来,国内智算的发展取得了举世瞩目的成绩,但人无远虑必有近忧。AI算力的自主化之路不能就此止步,而是要一鼓作气,再加把劲,把已经取得的成果夯实,为接下来的智能浪潮做好准备。避免低质量算力过剩与加速自主化智算发展,这两件事可以并行不悖,但也需要理性看待。

在智算建设的道路上,我们不能被短期的市场变化所迷惑,而要坚定信心,持续推进自主化智算的发展。只有这样,我们才能在全球AI竞争中占据有利地位,为国家的科技创新和产业升级提供强大的算力支撑。

同时,我们也要看到,智算建设并非一蹴而就,而是需要长期的投入和持续的优化。在这个过程中,我们需要加强技术创新和人才培养,推动智算产业的高质量发展。

总之,自主化智算建设是国家科技创新和产业升级的重要支撑,我们不能因为短期的市场变化而动摇信心。相反,我们应该坚定信念,持续推进智算建设,为国家的未来发展提供强大的算力保障。

 
 
更多>同类内容
全站最新
热门内容
本栏最新