毅伯智算推出DeepSeek满血一体机,性能领先英伟达40%!

   发布时间:2025-03-14 00:04 作者:顾雨柔

软硬协同算力领域的创新浪潮再次涌动,毅伯智算,一家专注于全栈自研的算力解决方案提供商,近期向市场推出了其最新的力作——TORA3000 8卡推理一体机,该设备搭载了性能强劲的满血版DeepSeek-R1-671B模型,旨在为行业带来前所未有的推理性能体验。

TORA3000的问世,不仅标志着毅伯智算在AI推理技术上的重大突破,更以其卓越的推理性能,对业界产生了深远影响。据官方数据显示,该一体机的推理性能相较于市场上的同类产品,如英伟达的H20-141G,提升了高达40%,成功跻身业界领先水平。这一成就的背后,是毅伯智算团队对软硬件一体化解决方案的深入探索与优化。

作为一家国内少有的实现全栈自研的算力解决方案提供商,毅伯智算拥有一支由超过百名AI工程师组成的精英团队,其中不乏在人工智能与超算领域拥有超过10年研发经验的核心成员。正是这样一支实力雄厚的团队,在过去三年中,始终致力于全栈式AI训推平台的研发,并最终在2024年推出了其自研的全栈式AI训推平台。

TORA3000作为毅伯智算在AI推理领域的又一力作,不仅实现了软硬件的一体化,更以其开箱即用的便捷性,全面满足了客户的推理需求。该一体机通过全自研的算子库、编译技术、推理框架等技术手段,实现了更快计算效率、长文本和高并发请求支持,以及更高的推理性能。同时,它还原生支持DeepSeek-R1-671B所采用的FP8精度,兼容FP64/32/16及INT8,在保证推理精度的同时,有效降低了部署成本。

对于企业用户而言,在选择Deepseek推理一体机时,往往会面临满血版与蒸馏版的选择。这两者之间的关系,类似于教师与学生的关系,其中满血版是知识输出者,而蒸馏版则通过知识蒸馏过程继承前者的知识。在实际应用中,满血版能够深度处理代码生成、知识图谱构建等高复杂度任务,而蒸馏版则受限于知识压缩与固定架构,仅适用于应用特别定义且相对简单的场景。因此,对于大中型企业而言,配置至少一台满血版一体机作为核心引擎,是支撑业务迭代与高密度推理需求的必要选择。

然而,受GPU硬件性能的限制,市场上满血版推理一体机的部署方案多种多样,包括单机、双机甚至四机等。其中,双机方案相较于单机方案,硬件成本和功耗都会翻倍,而四机方案则更高,且会增加额外的组网和运维成本。在Deepseek原生FP8精度下,一体机(8卡)要流畅运行满血模型,单卡显存需大于120G(整机显存大于1000GB),否则必须采用多机部署。同时,部分GPU不支持FP8运算,只能量化为INT8或FP16模型,但INT8精度下推理精度会有所下降,而FP16则会导致所需显存和节点数量翻倍。

面对这些挑战,毅伯智算凭借其TORA3000一体机,为市场提供了一个最优解。该一体机不仅支持原生FP8精度,且单卡显存超过120GB,完全满足高性能推理的需求。同时,经过采用开源数据集和开源测试工具对TORA3000与英伟达H20-141G的推理性能进行测试发现,TORA3000的性能提升高达40%,再次证明了其在业界领先地位。

 
 
更多>同类内容
全站最新
热门内容
本栏最新