免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 马斯克发布Grok3,AI回答经典问题“9.11和9.9哪个大”遭遇挑战

马斯克发布Grok3,AI回答经典问题“9.11和9.9哪个大”遭遇挑战

时间:2025-02-21 04:50

小编:小世评选

近日,特斯拉和SpaceX的CEO埃隆·马斯克在中正式发布了最新版本的AI模型Grok3。马斯克与他的xAI团队花了整个周末的时间打磨这一版本,他在X上称Grok3为“地球上最聪明的AI”。这一声明引发了公众的高度关注,尤其是在AI技术迅速发展的背景下,马斯克自信的言论增加了人们对Grok3的期待。

在发布后的不久,某些用户对Grok3进行了一系列测试,其中就包括一个经典的挑战性问题:“9.11和9.9哪个大?”这一问题常常被用来考验AI系统的基本逻辑和数学能力。遗憾的是,最新的Grok3在没有附加任何上下文或标识的情况下,未能正确回答这一问题,显示出其在处理常识性问题时的局限。

这一结果引发了广泛讨论。据报道,当用户向另一款AI模型DeepSeek提问相同的问题时,DeepSeek无论是在开启深度思考模式还是普通模式下,均能够准确回答“9.9大于9.11”。这种表现的差异让人们不由得对Grok3的智能水平产生了疑问。

这个问题在AI领域并非新鲜事。早在2018年,艾伦研究所的成员林禹臣就通过社交媒体分享了类似的案例,提到ChatGPT-4o曾错误地认为“13.11大于13.8”。这一现象揭示了AI在处理简单数学和常识问题时的不稳定性,尤其是在与复杂的逻辑推理相比时,后者往往表现得更加优越。

在Grok3的发布后,Scale AI的提示工程师莱利·古德赛德受此启发,重新提问“9.11和9.9哪个更大?”他将此问题抛给了一些当前市场上最强大的AI模型,包括ChatGPT-4o、谷歌的Gemini Advanced以及Claude 3.5 Sonnet等,结果令人失望的是,这些模型几乎都未能做出正确的选择。这种现象引发了网友们的调侃,戏称为“天才不愿意回答简单的问题”。

尽管出现了这样的问题,马斯克对于Grok3的表现并不感到失望。他在公开场合上表示,Grok3目前仍处于测试阶段,错误越多越好,这意味着开发团队将在大量的反馈中不断改进系统。他还透露完整版的Grok3将在未来几个月内推出,并欢迎用户反馈,从而进一步增强AI的智能水平。

这次事件不仅仅是关于Grok3或其他AI模型对简单数学问题表现的较量,它反映了当前AI技术的一个普遍挑战:虽然AI在复杂任务中展示出了惊人的能力,但在基础的常识判断和简单的逻辑推理上,依然有待加强。许多开发者和研究人员都在努力地平衡这两者的能力,使AI系统在科学推理和日常常识之间保持合理的表现。

未来,随着Grok3的不断迭代和改进,马斯克和他的团队希望能让这款AI在各种任务中都表现得更加优异。同时,这也给整个AI行业的研究者提供了一个重要的思考方向:如何在不断提升复杂任务执行能力的同时,确保模型在基本逻辑和常识判断方面的可靠性。

随着各大技术公司的不断投入和研究,AI技术将越来越成熟,面对挑战与测试,如何提升模型的智能水平,将成为未来发展的关键之一。希望未来的AI能更加聪明,能够轻松应对每一个简单的问题,也能在人类社会中发挥更大的作用。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多