实测Kimi探索版,中国版“o1大模型”来了?

   发布时间:2024-10-16 17:12 作者:陆辰风

近期,国内大模型市场迎来了一波新的创新热潮,多家厂商纷纷推出迭代产品,其中多模态领域尤为引人注目。自年初Sora发布后,国产文生视频大模型的进展备受关注。8月底,MiniMax推出了首个AI高清视频生成模型,紧接着9月,豆包发布了两款视频生成大模型,并获得灰测用户的高度评价。与此同时,科大讯飞也宣布将发布多模态视觉交互及超拟人虚拟人交互能力。然而,在这些新产品中,一款名为Kimi探索版的工具尤为引人关注。

Kimi探索版被视为国内对标OpenAI“推理时计算”能力o1的产品。据官方介绍,它能够模拟人类的推理思考全过程,执行深度搜索并反思改进结果,从而提供更加全面和准确的答案。这一特性使其在众多大模型中脱颖而出。Kimi探索版的产品负责人甚至表示,如果Kimi搜不到的信息,用户也很难通过传统搜索引擎找到。

那么,Kimi探索版究竟有何独特之处?它在技术上是如何实现模拟人类推理和思考的呢?官方解释,Kimi探索版通过自主规划策略,将复杂问题分解为层次化的子问题,然后分步执行,这与OpenAI的o1模型所采用的马尔可夫决策过程相似。这使得Kimi探索版在处理需要多步推算判断的问题时,表现出更强的能力。

为了验证Kimi探索版的能力,我们进行了一项测试。提出问题:“假设我在2024年9月2日有100000元,对比一下截至9月30日,购买腾讯港股和购买贵州茅台哪个方案的收益率更高?具体收益额会高出多少?”Kimi探索版将这个问题分为了查询、计算和结论三个步骤,最终给出了详细的答案和解释。

Kimi探索版还具备即时反思搜索结果、补充信息的能力。面对开放探索型问题,如果第一次回答的信息存在缺失,它会主动补充更多回答。面对数字相关的搜索问题,如果发现了数据冲突,它会及时提供多方视角的信息供参考决策。这一特性使其在搜索结果的准确性和全面性上更具优势。

尽管Kimi探索版在技术和功能上取得了显著突破,但仍存在一些需要正视的问题。其中之一是其在处理不同问题时,搜索的网页数量存在差异,导致结果的不一致性。这引发了对于技术、环境或算力因素的疑问。在处理特定类型的问题时,如数英文单词中字母“e”的数量,Kimi探索版仍存在一些错误。

尽管如此,Kimi探索版的出现仍然具有重要意义。它改变了过去大模型需要繁琐提示词才能输出想要结果的情况,通过模拟人类的推理思考过程,提供了更加全面和准确的答案。这为用户节省了搜索调研任务上的时间,使其能够更专注于提出问题、思考和创造。未来,随着技术的不断完善和用户体验的提升,Kimi探索版有望在国内AI搜索与大模型发展领域发挥更加重要的作用。

 
 
更多>同类内容
全站最新
热门内容
本栏最新