OpenAI发布GPT-4.5:史上最贵模型却在性能上不敌o3-mini
时间:2025-02-28 19:40
小编:小世评选
在北京时间2024年2月28日的凌晨,OpenAI正式推出了其新一代大模型——GPT-4.5。根据官方的说明,这款模型被誉为迄今为止最大的聊天模型,具有丰富的知识储备和广泛的应用潜力。尽管备受期待,GPT-4.5在性能测试中却被普遍认为未及竞争对手o3-mini的表现,引发了广泛的讨论和争议。
OpenAI的首席执行官山姆·奥特曼没有参与本次发布的,尽管他在社交媒体上提到GPT-4.5是一款“庞大而昂贵”的模型,并且指出当前的GPU资源已经不足以支撑其复杂的计算需求。他表示,GPT-4.5并不是单纯的推理模型,而是一种全新的智能形式,这让许多用户的期待稍显失落。
在中,OpenAI的研究负责人米娅(Mia)主持了Introduction部分,与去年发布GPT-4o时的气氛相比,今年的似乎显得更加紧张和拘谨。首次演示时,团队展示了GPT-4.5对一个简单聊天提示的应答能力。面对“我的朋友放了我鸽子,我给他发信息说我恨他”的请求,GPT-4.5不仅写出了短信,还尝试理解用户的情感,而给出了一条更为委婉和情感丰富的回复。
尽管如此,贝壳财经的记者在随后进行了相同的提示输入测试后,发现o3-mini同样能够以幽默而恰当的方式回应,表明用户的真实需求,甚至提供了一些有趣的调侃选项,例如“请我喝奶茶我可考虑原谅你三分钟”。显然,在这一层面的竞争中,GPT-4.5似乎并未取得显著优势。
为了弥补在性能展示上的短板,团队还回顾了自2018年以来GPT系列模型的演变历程。在回答“为什么海水是咸的”这一问题时,中提到,GPT-1完全无法理解,GPT-2开始有了一些相关的输出,GPT-3.5首次给出了完整的答案,而GPT-4.5则在内容的流畅性和阅读的韵律上有所提升。这种对模型历程的追溯,似乎意在强调GPT-4.5在更广泛的知识维度上的优势。
GPT-4.5的实际性能却无法为其高昂的价格找到合理的解释。根据性能测试数据,GPT-4.5在多个维度上的表现不及o3-mini,尤其是在科学、数学和编程相关问题的回答上明显逊色。值得注意的是,虽然在多模态处理方面GPT-4.5略占上风,但整体表现仍然无法令人信服。
在API定价上,GPT-4.5也创造了OpenAI历史上的新高,每百万Tokens的价格高达75美元,远高于GPT-4o的2.5美元和o3-mini的41美元。这一价格差异让不少用户感到震惊,甚至在OpenAI的评论区出现了质疑,表示这样的定价似乎是“写错了”。
尽管OpenAI在中强调,ChatGPT的Pro用户将能即刻体验到GPT-4.5的功能,并承诺其“无监督学习”的优势将为未来的发展奠定基础,然而当前的反馈指向一个现实:高昂的开发成本及其未必合理的性能定位,使得GPT-4.5的推出面临相当大的压力与怀疑。
米娅在中再次提到,模型的推理能力虽然重要,但GPT-4.5确实是无监督学习的前沿代表,集合了更多的知识与智慧,旨在为未来更强大的模型铺垫基础。对于许多期待突破与创新的用户而言,怎样的智能才算得上“强大”,GPT-4.5的表现显然还未达到普遍认可的标准。
在AI领域迅速发展的大环境下,OpenAI的这一新产品能否逆转当前的用户评价和市场反响,仍然有待观察。对于用户而言,他们希望看到的不仅是优美的功能展示,更是实用性和经济性兼备的解决方案。在竞争日趋激烈的智力应用市场,如何平衡研发投入、性能表现与市场反馈,将直接影响OpenAI未来的战略走向。