马斯克推出‘地球上最聪明的AI’ Grok3，常识测试中遭遇尴尬

时间：2025-02-20 07:20

小编：小世评选

在科技界备受期待的活动中，亿万富翁企业家马斯克与他的xAI团队共同推出了新一代AI模型——Grok3。早在发布前，马斯克便在社交媒体X上透露，过去的周末他几乎全程投入到Grok3的完善和优化中，这使得此次发布充满了神秘气息。尽管Grok3被称作“地球上最聪明的AI”，其在一次经典的常识性测试中却遭遇了重重难关，引发了业内对其智能水平的广泛质疑。

在发布会中，马斯克展示了Grok3在多个领域的出色表现，但在被询问“9.11与9.9哪个大？”这一经典问题时，Grok3未能作出正确的判断。这一结果不仅让现场观众感到意外，也为“最聪明的AI”这一说法增添了不少争议。相比之下，另一款AI模型DeepSeek在面对同样的问题时则表现游刃有余，准确而迅速地回答了“9.9大于9.11”。这种反差让人们重新审视Grok3的能力。

“9.11与9.9哪个大”的问题实际上是AI领域的一个经典测试案例。早前，艾伦研究机构的成员林禹臣就曾指出，尽管人工智能在解答复杂的数学问题上获得了显著进步，但在常识判断方面仍然面临着巨大的挑战。这一观点已被多方研究证实。事实上，在Grok3推出之前，Scale AI的提示工程师莱利·古德赛德就曾对当时主流的多种AI模型进行了类似的测试，结果让人失望地发现，包括ChatGPT-4、谷歌的Gemini Advanced及Claude 3.5 Sonnet等广受欢迎的模型均未能正确回答问题。这一系列事件进一步凸显了当前AI在常识性问题上的局限性。

尽管Grok3在常识测试中表现不佳，马斯克却并未因此动摇对其的信心。在发布会上，他强调，xAI的使命是“理解宇宙”，而Grok3正是这一目标的重要一步。马斯克表示，Grok3在数学、科学和编程等基准测试中已经超越了现有的主流模型，并对其未来在SpaceX的火星任务计算中应用充满期待。他相信，随着后续不断的训练与完善，Grok3有可能成为真正强大的智能助手。

为了提升Grok3的性能，xAI团队投入了大量算力与合成数据进行训练。这一过程中，他们借助了由10万个英伟达H100 GPU构成的Colossus超级计算机，提供了高达2亿个GPU小时的训练资源。可以说，这种庞大的算力支持为Grok3在复杂任务中展现优异性能奠定了基础。Grok3不仅在理论上具备强大的科技支撑，其算法设计与多样化的数据处理能力也极大提升了其智能表现。

除了Grok3，xAI还在发布会中宣布推出了一款名为Deepsearch的智能搜索引擎。尽管Deepsearch与DeepSeek在名称上极为相似，但这两者在算法与技术路径上有着显著的区别。Deepsearch的推出显示了xAI在不断扩展其产品线，目的在于为用户提供更丰富多元的服务，进一步巩固其在AI领域的地位。

纵观整个发布会，虽然Grok3在常识性测试中的表现令人失望，但它的推出标志着人工智能技术向前迈出了一步。马斯克与他的团队显然意识到了AI在常识判断方面尚需加强的重要性，而Grok3在数学和科学等领域卓越的表现也让人期待其未来的发展。

未来，xAI仍将继续优化Grok3，并努力克服AI在常识判断上所面临的难题。通过不断的研究与实践，马斯克团队希望能够真正实现“最聪明的AI”的目标。在这一过程中，科技爱好者和AI研究者将持续密切关注Grok3以及其他AI模型的演进，希望能见证人工智能在各个领域取得更大的突破。

马斯克推出‘地球上最聪明的AI’ Grok3，常识测试中遭遇尴尬

精品推荐

相关文章