马斯克发布Grok3，AI回答经典问题“9.11和9.9哪个大”遭遇挑战

时间：2025-02-21 04:50

小编：小世评选

近日，特斯拉和SpaceX的CEO埃隆·马斯克在中正式发布了最新版本的AI模型Grok3。马斯克与他的xAI团队花了整个周末的时间打磨这一版本，他在X上称Grok3为“地球上最聪明的AI”。这一声明引发了公众的高度关注，尤其是在AI技术迅速发展的背景下，马斯克自信的言论增加了人们对Grok3的期待。

在发布后的不久，某些用户对Grok3进行了一系列测试，其中就包括一个经典的挑战性问题：“9.11和9.9哪个大？”这一问题常常被用来考验AI系统的基本逻辑和数学能力。遗憾的是，最新的Grok3在没有附加任何上下文或标识的情况下，未能正确回答这一问题，显示出其在处理常识性问题时的局限。

这一结果引发了广泛讨论。据报道，当用户向另一款AI模型DeepSeek提问相同的问题时，DeepSeek无论是在开启深度思考模式还是普通模式下，均能够准确回答“9.9大于9.11”。这种表现的差异让人们不由得对Grok3的智能水平产生了疑问。

这个问题在AI领域并非新鲜事。早在2018年，艾伦研究所的成员林禹臣就通过社交媒体分享了类似的案例，提到ChatGPT-4o曾错误地认为“13.11大于13.8”。这一现象揭示了AI在处理简单数学和常识问题时的不稳定性，尤其是在与复杂的逻辑推理相比时，后者往往表现得更加优越。

在Grok3的发布后，Scale AI的提示工程师莱利·古德赛德受此启发，重新提问“9.11和9.9哪个更大？”他将此问题抛给了一些当前市场上最强大的AI模型，包括ChatGPT-4o、谷歌的Gemini Advanced以及Claude 3.5 Sonnet等，结果令人失望的是，这些模型几乎都未能做出正确的选择。这种现象引发了网友们的调侃，戏称为“天才不愿意回答简单的问题”。

尽管出现了这样的问题，马斯克对于Grok3的表现并不感到失望。他在公开场合上表示，Grok3目前仍处于测试阶段，错误越多越好，这意味着开发团队将在大量的反馈中不断改进系统。他还透露完整版的Grok3将在未来几个月内推出，并欢迎用户反馈，从而进一步增强AI的智能水平。

这次事件不仅仅是关于Grok3或其他AI模型对简单数学问题表现的较量，它反映了当前AI技术的一个普遍挑战：虽然AI在复杂任务中展示出了惊人的能力，但在基础的常识判断和简单的逻辑推理上，依然有待加强。许多开发者和研究人员都在努力地平衡这两者的能力，使AI系统在科学推理和日常常识之间保持合理的表现。

未来，随着Grok3的不断迭代和改进，马斯克和他的团队希望能让这款AI在各种任务中都表现得更加优异。同时，这也给整个AI行业的研究者提供了一个重要的思考方向：如何在不断提升复杂任务执行能力的同时，确保模型在基本逻辑和常识判断方面的可靠性。

随着各大技术公司的不断投入和研究，AI技术将越来越成熟，面对挑战与测试，如何提升模型的智能水平，将成为未来发展的关键之一。希望未来的AI能更加聪明，能够轻松应对每一个简单的问题，也能在人类社会中发挥更大的作用。

马斯克发布Grok3，AI回答经典问题“9.11和9.9哪个大”遭遇挑战

精品推荐

相关文章