在科技界引发广泛讨论的AI新秀Manus,近日成为了舆论焦点。从初露锋芒到一码难求,再到围绕其宣发投入的巨大争议,整个过程充满了FOMO(错失恐惧症)情绪与理性审视的交织,为传播学研究提供了鲜活案例。
近年来,AI行业似乎总能以“爆炸性新闻”的形式闯入公众视野,对于内行人而言,这些报道早已失去了新鲜感,而外行人则往往对每一次“爆炸”都感到震惊。然而,在这连绵不绝的“爆炸”声中,偶尔也会有真正具有突破性意义的成果被掩盖其中。
Manus,无疑是那少数真正配得上“爆炸性”评价的AI产品之一。它被视为AI Agent领域的DeepSeek时刻——更准确地说,是DeepSeek-V2之后的进阶版。2024年5月,DeepSeek开源V2版本时,虽然价格亲民,但因能力平平而未引起足够重视。直到V3和R1版本的相继发布,才彻底颠覆了大模型市场的成本逻辑。
Manus的演示效果令人印象深刻:在短短一个小时内,它便能开发出一款模拟谷歌CEO决策过程的文字互动游戏。玩家可以在游戏中扮演谷歌CEO,通过历史决策了解公司文化,体验感十足。这一能力展示了AI Agent与传统对话式AI的本质区别:它不仅能提供信息层面的回答,更能自主操作电脑完成具体工作任务,如编写程序、设计网页、撰写报告等。
中国大模型团队Monica开发的Manus,目前仍处于免费测试阶段,但已展现出强大的实力。其单任务成本仅为2美元,是OpenAI的十分之一,同时在基准测试排行榜上超越了OpenAI,成为全球最强。笔者有幸获得邀请码,并在短时间内耗尽了Manus的单日计算资源,体验效果震撼。
在实际应用中,Manus同样表现出色。例如,笔者让它制作一个linktree风格的个人主页,它迅速搜集资料、编写代码,半小时内便交付了符合要求的作品。它还帮助一位工程师朋友解决了阿特拉斯机械臂的维修问题,通过自主下载和分析文档,成功创建了修复程序,节省了高昂的售后费用。
不仅如此,Manus还能根据需求创作内容。笔者让它制作一个英国极简编年史网页,它成功地将历史分成不同时代,并绘制了SVG图片。虽然配色略显生硬,但整体效果令人惊喜,展现了人机协同的巨大潜力。
当然,Manus也并非无所不能。在尝试制作一款以原神角色为图标的消消乐游戏时,它因无法注册网盘账号下载资源而发出接管请求。这一插曲表明,即使再强大的AI,也会受到网络限制。
尽管如此,Manus在解决复杂问题时的表现仍令人印象深刻。它不仅能自主完成任务,还能通过回放功能展示思考过程,为用户提供启发。这一设计使得AI的思考过程成为了一种智能资产,具有教育意义。
综合来看,Manus作为AI Agent领域的佼佼者,已将此类服务从专业场景推向了通用场景。其强大的功能性、对任务的熟练拆解以及CoA(代理链)的观测能力,都展现了其开山立派的地位。随着技术的不断发展,我们有理由期待Manus及同类产品在更多领域发挥巨大作用。