在瑞士达沃斯举办的世界经济论坛上,微软首席执行官萨提亚·纳德拉发表了对中国AI技术进展的高度评价。他特别提到了DeepSeek的新模型,称赞其在开源模型开发和推理计算方面的高效表现。
“DeepSeek的新成果确实令人瞩目,”纳德拉说道,“特别是在计算效率上,它的表现极为出色。我们必须认真对待来自中国的这些技术突破。”
近期,DeepSeek-R1在大模型竞技榜上取得了显著成绩,与ChatGPT-4o并列前三。值得注意的是,DeepSeek-R1以开源和成本效益极高的优势脱颖而出,其价格仅为ChatGPT-4o的二十分之一。此前,已有消息透露,Facebook母公司meta成立了四个专项研究小组,致力于分析DeepSeek的工作原理,并计划将其应用于改进旗下的大模型Llama。
DeepSeek-R1推理大模型于本月20日正式发布。据官方介绍,该模型在后训练阶段大规模运用了强化学习技术,即便在标注数据极少的情况下,也成功提升了模型的推理能力。在数学、代码编写和自然语言推理等任务上,DeepSeek-R1的性能与OpenAI的o1正式版不相上下。
Deepseek应用在发布后迅速走红,不仅在中国地区苹果应用商店免费下载排行榜上登顶,还在美国地区超越了ChatGPT,成为下载量最高的免费应用。