研究显示大多数AI搜索引擎准确性低,误信息问题严重
时间:2025-03-13 22:50
小编:小世评选
根据IT之家报道,哥伦比亚大学数字新闻研究中心(Tow Center for Digital Journalism)最近发布了一项研究,评估了八款流行的人工智能搜索引擎的表现。研究小组对每款引擎的准确性进行了深入测试,目的是识别这些工具在提供信息时所面临的主要问题,尤其是关于误信息的传播。
该研究通过对来自20家新闻机构的200篇文章进行分析,挑选出每个搜索在进行问题查询时,能确保结果在谷歌搜索中排名前列的内容。研究人员采用了相同的查询方式对各个AI搜索引擎进行测试,以检验它们的引用是否精准可靠。
测试结果显露了明显的差距:除了Perplexity及其付费版以外,其余所有的AI搜索引擎在准确性方面的表现都令人失望。整体来看,这些AI工具提供的信息往往是不准确的,有些还会进一步加剧信息的不准确性。这一点让人感到特别值得重视,因为它验证了外界对于AI搜索引擎长期以来的担忧和质疑。
研究表明,许多AI搜索引擎常常错误地陈述信息,并在被质疑时试图自圆其说,造成了更大的误导。以ChatGPT为例,尽管在所有200个新闻查询中它是唯一一个进行了回应的AI工具,但其“完全正确”回答的比例仅为28%。惊人的是,这款工具的“完全错误”回答比例竟高达57%。甚至在承认错误后,ChatGPT往往仍会在随后给出的答案中继续编造内容,这是因为在大语言模型的设置中,这种情况几乎是普遍存在的。
在表现不佳的AI工具中,ChatGPT并不是最糟糕的。X旗下的Grok AI显然是表现最差的,其中Grok-3 Search的准确率让人堪忧。而微软的Copilot同样问题重重——在200次查询中,仅有16次被认为“完全正确”,14次被标记为“部分正确”,而令人震惊的是有66次被认定为“完全错误”。这种反馈和结果使得用户对AI搜索引擎的信任度大打折扣,特别是在信息获取变得如此重要的当下。
尽管这些AI工具的表现令人失望,它们的开发公司仍然向用户收取高额的订阅费用,每月费用在20至200美元(约合145至1449元人民币)不等。而付费版的Perplexity Pro和Grok-3 Search相较于免费版,在回答数量上虽然有所增加,却并未改善信息的准确性,反而显示出更高的错误率。
这项研究不仅揭露了AI搜索引擎在信息准确性方面的短板,也使我们对其在未来信息获取和传播中的角色充满了担忧。信息时代的我们依赖这些技术工具来获取信息,但这些工具的误导性将会对我们的决策造成直接影响。
随着人工智能的快速发展,相关技术需要得到更严格的监管和评估,以确保用户能从中获得可靠的信息源。AI开发者应当更加重视算法的设计和数据,以避免错误信息的传播。对于消费者保持对这些技术工具的批判性思维,能够有效减少受到误信息影响的可能性。
在未来,期望AI搜索引擎能够对其内容的来源进行更严谨的验证和筛选,通过增强其回答的准确性来提升用户的信任度。只有在确保信息质量的前提下,智能搜索技术才能真正服务于用户,助力知识传播,提升认知水平。在这个数字时代,信息的准确性与完整性显得尤为重要,因此我们不能忽视在AI技术飞速发展的同时所应承担的社会责任。