狂欢背后的冷思考:Open AI“网红化”搅动AI圈

   发布时间:2024-11-18 19:27 作者:唐云泽

文 | 明晰野望,作者丨林森

Open AI作为AI时代的科技先锋,每一个动向都备受关注。但是吃多了“网红化”带来的流量红利,Open AI似乎很难像学者一样老实待在实验室了。

马斯克犀利批判,AGI团队负责人黯然离职,光环下的深度推理大模型性感却似乎遥不可及。

中国AI行业在ChatGPT的刺激下这两年集体追赶预训练大模型,对资源、数据、算力大笔投入。

面对Open AI抛出的新动作,从预训练模型到深度推理模型转技术路线,跟或不跟?选择发展应用还是死磕大模型技术?这些都成为全球AI圈新的选择题。

李开复揭秘o1模型上线幕后

Open AI越来越喜欢搞大新闻。

2024年9月,在ChatGPT4o模型推出没有几个月,Open AI就发布了号称“迄今为止功能最强大”的o1系列模型,其首席执行官‌山姆·奥特曼称这是“新范式的开始,人工智能可以进行复杂推理了”。

这就是所谓的“深度推理模型”。简单说,它最与众不同的是,回答之前会思考,产生一个很长的内部思维链,逐步推理,模仿人类思考复杂问题的过程。

o1模型是首个通过大规模强化学习算法训练的模型,其对“算法”和“算力”的要求,可能更甚于“数据”。

如果预训练模型是 “数据贪吃蛇”,那么深度推理更需要“算法大师”,并同样是“算力消耗大户”。

有人说,“以前的预训练大模型是学习数据,o1 更像在学习思维。”预训练模型是靠海量数据和算力堆砌的高级版信息搜索和提炼概括,推理则被认为是 AI实现人类或超人类水平智能的关键。o1模型似乎离真正的“人工智能”更近了一步。

Open AI犹如新的大杀器,搅乱全球大模型圈。

从 OpenAI 公布的评测结果来看,o1在 Codeforces 编程竞赛中超过了89%的参赛者,在美国数学奥林匹克竞赛的资格赛中名列全美前500名,在物理、生物和化学问题的基准测试中超越了人类博士水平的准确率。

之前Open AI 将 AGI(通用人工智能)划分了五个发展阶段,其中第一级「ChatBots」聊天机器人,典型的就是ChatGPT;第二级「Reasoners」推理者,解决博士水平基础问题的系统。o1模型发布代表Open AI在向外宣称,其实现了AI能力的跃迁,达到了人工智能发展阶段的第二级。

如果真是这样,这也将意味着Open AI再次大幅领先,把其他所有还在发展预训练模型,追赶ChatGPT路线的一众大模型厂家再次甩在身后。

目前o1仅有少数模型对高级别付费用户开放。但根据实测来看,o1的水准可能差强人意。

例如,o1在很多方面甚至不如 GPT-4o,仅支持文本,不能看,不能听,没有浏览网页或处理文件和图像的能力。还有内测的 AI 安全研究公司 Apollo Research 发现,o1 可能会假装遵循规则完成任务。数学家陶哲轩直言,“使用 o1 就像在指导一个水平一般但不算太没用的研究生。”

更有甚者,苹果日前放出了一篇论文,暗示了Open AI的o1模型不会推理,这篇论文论证了例如给小学数学题加句“废话”插入无关信息,就会干扰推理。

Open AI用o1模型“卷”同行,真的是技术能力的跃迁吗?

近期零一万物CEO李开复在一则公开对话里透露的“八卦”道出了内幕。

他直言,“我刚从硅谷回来,听说GPT5的训练不太顺利,因为10万张集群蛮难搞定的。但是Open AI又要融资,GPT5没有出来,没有一个由头让投资人投资,因为大家都在追赶,有些也快赶上了,所以他只有祭出了一个内部准备不发布的o1。”

不过李开复并没有过多评价o1模型,对Open AI的评价依然很高,他援引Open AI内部人士说法,Open AI还有很多“好东西”没有发布,很多已经做出来了。

Open AI原本定位是一家非营利组织,但它正在迅速转变为营利性公司。近期Open AI 以 1570 亿美元估值融资 66 亿美元,成为硅谷史上最大的一次融资。据《华尔街日报》报道,微软和OpenAI都聘请了投资银行,以咨询重组后的治理权和股权安排。

初心之变的背后,不仅有o1模型的仓促面世。今年以来,Open AI已经有十余位中高层领导先后出走。就11月9日,上任OpenAI研究与安全副总裁仅3个月后,OpenAI 安全系统团队负责人翁荔(Lilian Weng)宣布将离开O这家自己已经工作近 7 年的公司。

这些迹象都在表明,Open AI正在从“学者”变成了“网红”,似乎一刻也不想离开热搜。但如果企业一直没有实质性技术进展,人们的阈值将会不断改变。

大模型竞赛转向“务实化”

在大洋的另一边,中国大模型公司走出了另一条道路。

在追赶算力和数据方面,正如李开复所言,许多同行包括中国公司,已经追平ChatGPT4o。

例如,腾讯的混元大模型今年不断升级,根据官方资料,相比前代模型,最新的混元Turbo性能显著提升,训练效率提升108%,推理效率提升100%,推理成本降低 50%,效果在多个基准测试上对标GPT-4o,且第三方测评居国内第一。

李开复的零一万物也在10月份官宣,其新的预训练旗舰模型 “闪电”,在国际权威盲测榜单 LMSYS 上超越了 Open AI 。

预训练模型对大数据和算力投入要求极高,再加上新的o1模型面世,还是有人动摇了。近期业内关于“中国AI六小虎”(智谱AI、零一万物、月之暗面、百川智能、MiniMax、阶跃星辰)中有公司要放弃大模型的消息喧嚣尘上。

但是许多互联网头部公司仍在坚持投入大模型技术。根据最新财报,腾讯一个季度在研发上的投入就高达179亿元,阿里也高达142亿元。两家公司不约而同强调,要继续投入AI。

观察发现,中国大模型行业已经出现了两种发展路径——

第一种,例如腾讯、阿里、字节跳动、百度这样的互联网头部公司,仍在坚持预训练模型这一战略级技术路线,并持续投入,走出了“内部应用提效+外部行业输出”的务实路径。

在巨额投入后,技术快速成熟,这些大厂的大模型能力不仅追赶上ChatGPT,其大模型技术还在内部和各业务结合落地,带动业务新发展,例如百度的搜索、腾讯的广告和SaaS产品、阿里的电商等业务都已经受益于AI提效升级。阿里巴巴在最新财报表示,AI收入连续五季度增长。

同时,这些大厂把成熟的大模型算力和技术向行业输出,一方面实现新的商业化,另一方面助力各行业搭上AI的快车,带动整个中国人工智能的发展。今年中国快速出现大模型技术降价潮,不得不说正是头部大厂们通过资源投入快速带动了行业发展,是件好事。

第二种,中小型创业公司同样务实,聚焦发展各类AI应用创新。

以“大模型六小虎”为例,它们在今年前10个月的技术进展中,纷纷展示了各自在AI应用领域的成果。

月之暗面的Kimi探索版具备AI自主搜索能力,智谱AI的AutoGLM实时语音互动应用开始内测,百川智能推出首款AI助手“百小应”,MiniMax将发布端到端实时语音通话API产品……

这些应用不仅丰富了AI产品的形态,也为创业公司们带来了商业化的可能。

 
 
更多>同类内容
全站最新
热门内容
本栏最新