中国AI新秀DeepSeek:何以低成本超越,撼动全球科技版图?

   发布时间:2025-01-28 04:32 作者:钟景轩

近日,全球科技界被一家成立仅一年多的中国AI创业公司——DeepSeek(深度求索)所震撼。据彭博社报道,DeepSeek的AI模型在性能上已媲美世界上最顶尖的聊天机器人,但其成本却似乎远低于这些竞争对手,这一突破性进展让美国硅谷为之震惊。

DeepSeek的崛起打破了业界对AI未来发展的传统认知。过去,人们普遍认为AI的进步需要持续的算力和能源投入作为支撑。然而,DeepSeek的创新似乎颠覆了这一观念。随着该公司引发的热潮不断升温,投资者开始重新评估其对美国竞争对手及其硬件供应商的影响,这也导致了全球科技股在本月底的大幅下跌。

DeepSeek由量化基金幻方量化的负责人梁文峰于2023年创立。该公司开发的AI模型采用了开源策略,这意味着整个开发人员社区都可以参与检查和改进软件。这一策略迅速吸引了大量用户,其移动应用在发布后迅速攀升至美国iPhone下载排行榜的榜首。

DeepSeek的AI模型与其他聊天机器人的最大区别在于,它在响应提示之前会明确阐明其推理过程。该公司声称,其R1版本提供的性能与OpenAI的最新版本相当,并已向有兴趣使用该技术开发聊天机器人的个人开放许可。这一举措进一步巩固了DeepSeek在AI领域的地位。

尽管DeepSeek并未全面披露其R1新模型的细节,但该模型的训练和开发成本似乎远低于OpenAI或meta等公司的最强产品。R1的高效率引发了业界对AI加速器需求的重新思考,也让人们更加关注美国针对中国的先进AI芯片出口管制。这些管制措施原本旨在防止中国取得类似DeepSeek的突破。

DeepSeek的R1模型在多个基准测试中表现出色,甚至超越了竞争对手的模型。例如,在测试数学能力的AIME 2024、测试常识的MMLU和测试问答性能的Alpacaeval 2.0等测试中,R1均取得了优异成绩。它还在加州大学伯克利分校研究生开发的AI系统排名网站Chatbot Arena上名列前茅。

自2023年发布最早模型以来,DeepSeek一直备受关注。去年11月,该公司向世界展示了其旨在模仿人类思维的DeepSeek R1推理模型,该模型为其移动聊天机器人应用提供了强大的技术支持。随着网页版的推出,该聊天机器人迅速成为全球知名的廉价OpenAI替代品。硅谷知名投资人马克·安德森甚至将其称为“AI的斯普特尼克时刻”,这一比喻凸显了DeepSeek对全球科技界的震撼程度。

据市场追踪公司数据显示,截至今年1月25日,DeepSeek移动应用已被下载超过160万次,并在澳大利亚、加拿大、中国、新加坡、美国和英国的iPhone应用商店中排名第一。这一数据充分证明了DeepSeek在全球范围内的受欢迎程度。

DeepSeek的创始人梁文峰是一位出生于1985年的广东人,他拥有浙江大学电子与信息工程的学士和硕士学位。他以1000万元人民币的注册资本创立了DeepSeek,并带领公司取得了今天的辉煌成就。在接受媒体采访时,梁文峰表示,进一步进步的瓶颈不是更多的融资,而是美国对获得最佳芯片的限制。他强调了中国需要发展自己的国内生态系统的重要性。

在中国AI行业,DeepSeek凭借其开源策略脱颖而出。这一策略不仅迅速吸引了大量用户,还降低了中国AI开发商的成本。在过去一年半的时间里,其他规模更大的公司在中国打起了价格战,连续降价以争夺市场份额。DeepSeek的成功也对全球AI市场产生了深远影响。

OpenAI和其他美国AI供应商可能会因DeepSeek的成功而降低价格,以保持其现有领先地位。同时,这也引发了人们对meta、微软等公司巨额支出的质疑。这些公司已经承诺将在今年投入巨额资本支出用于AI基础设施的建设。然而,如果效率更高的模型能够用更少的投入与现有的模型竞争,那么这些传统的大规模资金投入模式将面临挑战。

DeepSeek的崛起还引发了全球股市的动荡。投资者开始抛售受益于AI服务需求激增的公司股票,如英伟达和阿斯麦等。而与DeepSeek有关的中国公司股价则出现上涨。全球开发者已经开始尝试使用DeepSeek的软件并希望基于它开发工具。这可能加速先进AI推理模型的普及,但同时也可能引发更多关于如何设立使用护栏的担忧。

尽管DeepSeek取得了显著进展,但其云基础设施可能会因其模型的突然走红而受到考验。例如,在1月27日,该公司就经历了一次短暂的大宕机。随着新老用户向其聊天机器人提出更多问题,DeepSeek将不得不应对更大的流量挑战。

 
 
更多>同类内容
全站最新
热门内容
本栏最新