马斯克推出‘地球上最聪明的AI’ Grok3,常识测试中遭遇尴尬
时间:2025-02-20 07:20
小编:小世评选
在科技界备受期待的活动中,亿万富翁企业家马斯克与他的xAI团队共同推出了新一代AI模型——Grok3。早在发布前,马斯克便在社交媒体X上透露,过去的周末他几乎全程投入到Grok3的完善和优化中,这使得此次发布充满了神秘气息。尽管Grok3被称作“地球上最聪明的AI”,其在一次经典的常识性测试中却遭遇了重重难关,引发了业内对其智能水平的广泛质疑。
在发布会中,马斯克展示了Grok3在多个领域的出色表现,但在被询问“9.11与9.9哪个大?”这一经典问题时,Grok3未能作出正确的判断。这一结果不仅让现场观众感到意外,也为“最聪明的AI”这一说法增添了不少争议。相比之下,另一款AI模型DeepSeek在面对同样的问题时则表现游刃有余,准确而迅速地回答了“9.9大于9.11”。这种反差让人们重新审视Grok3的能力。
“9.11与9.9哪个大”的问题实际上是AI领域的一个经典测试案例。早前,艾伦研究机构的成员林禹臣就曾指出,尽管人工智能在解答复杂的数学问题上获得了显著进步,但在常识判断方面仍然面临着巨大的挑战。这一观点已被多方研究证实。事实上,在Grok3推出之前,Scale AI的提示工程师莱利·古德赛德就曾对当时主流的多种AI模型进行了类似的测试,结果让人失望地发现,包括ChatGPT-4、谷歌的Gemini Advanced及Claude 3.5 Sonnet等广受欢迎的模型均未能正确回答问题。这一系列事件进一步凸显了当前AI在常识性问题上的局限性。
尽管Grok3在常识测试中表现不佳,马斯克却并未因此动摇对其的信心。在发布会上,他强调,xAI的使命是“理解宇宙”,而Grok3正是这一目标的重要一步。马斯克表示,Grok3在数学、科学和编程等基准测试中已经超越了现有的主流模型,并对其未来在SpaceX的火星任务计算中应用充满期待。他相信,随着后续不断的训练与完善,Grok3有可能成为真正强大的智能助手。
为了提升Grok3的性能,xAI团队投入了大量算力与合成数据进行训练。这一过程中,他们借助了由10万个英伟达H100 GPU构成的Colossus超级计算机,提供了高达2亿个GPU小时的训练资源。可以说,这种庞大的算力支持为Grok3在复杂任务中展现优异性能奠定了基础。Grok3不仅在理论上具备强大的科技支撑,其算法设计与多样化的数据处理能力也极大提升了其智能表现。
除了Grok3,xAI还在发布会中宣布推出了一款名为Deepsearch的智能搜索引擎。尽管Deepsearch与DeepSeek在名称上极为相似,但这两者在算法与技术路径上有着显著的区别。Deepsearch的推出显示了xAI在不断扩展其产品线,目的在于为用户提供更丰富多元的服务,进一步巩固其在AI领域的地位。
纵观整个发布会,虽然Grok3在常识性测试中的表现令人失望,但它的推出标志着人工智能技术向前迈出了一步。马斯克与他的团队显然意识到了AI在常识判断方面尚需加强的重要性,而Grok3在数学和科学等领域卓越的表现也让人期待其未来的发展。
未来,xAI仍将继续优化Grok3,并努力克服AI在常识判断上所面临的难题。通过不断的研究与实践,马斯克团队希望能够真正实现“最聪明的AI”的目标。在这一过程中,科技爱好者和AI研究者将持续密切关注Grok3以及其他AI模型的演进,希望能见证人工智能在各个领域取得更大的突破。