近年来,AI技术的飞速发展正在悄然改变我们的搜索习惯。Gmail的创始人之一Paul Buchheit曾预言,AI将颠覆搜索引擎的结果页面,这一观点如今在中国市场得到了验证。
过去的一个多月里,百度、夸克、微博、知乎、小红书等平台纷纷接入了DeepSeek技术,与大模型的深度思考能力相结合,重新定义了内容的呈现方式,开启了一场“深度搜索”的竞争。这些平台利用DeepSeek R1(联网搜索)技术,为用户提供更加精准、有价值的信息。
为了测试这些平台的“深度搜索”能力,我们围绕日常生活中经常遇到的问题,包括健康、数码、美妆、游戏和时事热点,对DeepSeek R1、百度AI搜索、夸克、微博智搜、知乎直答、小红书的AI搜索应用“点点”进行了横向对比。
首先,我们提出了一个关于儿童换季过敏的问题。六个平台都给出了及格线以上的答案,涵盖了常见的过敏原、过敏症状及日常护理注意事项等。原本需要花费大量时间查阅多篇文章或视频的知识点,现在只需等待几十秒即可获得。在这些答案中,夸克提供了更为详实的建议,包括皮肤护理、呼吸道护理、饮食调整、药物治疗和中医调理等,显示出内容的多样性。
接下来,我们测试了一个关于电脑内存条的问题。这个问题看似专业,实则隐藏了一个陷阱,用来测试不同AI搜索的用户友好性。六个平台在准确性上没有明显差距,都考虑到了不同的使用场景、兼容性和稳定性。然而,在答案的呈现方式上,DeepSeek R1、微博智搜、知乎直答和“点点”更加用户友好,它们先引导用户根据需求对号入座,再结合专业知识进行解释。微博智搜和“点点”还引用了专业数码博主的科普视频,使得答案更加通俗易懂。
在美妆问题上,我们选择了含玻色因和视黄醇的护肤品能否一起使用这一话题。由于时尚美妆是内容营销的“重灾区”,我们测试了AI搜索能否处理营销味儿较重的内容,给出一份客观的答案。百度和夸克在这个问题上表现较好,尽管答案中出现了产品名,但整体上仍然比较客观,自动过滤了一些“软植入”,成分介绍、注意事项和使用建议也相对准确。然而,“点点”在这个问题上“翻车”了,答案中出现了营销味儿浓重的辅助方案和图片。
最后,我们测试了一个关于时事热点的问题——平价的蜜雪冰城是否拥有塌房豁免权。这个问题源于315晚会对蜜雪冰城门店使用隔夜柠檬片的报道,在舆论端出现了反差。DeepSeek R1、夸克和百度主要参考的是新闻报道和自媒体文章,答案里的措辞有所不同,但逻辑相似。微博智搜在回答中提到了消费平权、品牌形象的防御性建构和危机传播的娱乐化消解,让我们看到了更多的维度。而“点点”则提到了情感绑架、自我PUA式消费等议题,反映了平台用户的价值观。知乎直答提到了“消费降级”,同样展示了平台内容的差异化。
通过这些测试,我们发现大模型的深度思考能力决定了体验的下限,但内容决定了体验的上限。各个平台在底层技术能力上实现了对齐,最大的差异在于所拥有的内容资源。社交平台上的UGC内容成为了一把双刃剑,既可能让答案更有“人情味儿”,也可能“污染”生成内容的准确性。因此,如何在特定领域调整UGC内容的权重,引入权威、可信的内容,成为深度搜索平台需要面对的挑战。