OpenAI发布GPT-4.5：史上最贵模型却在性能上不敌o3-mini

时间：2025-02-28 19:40

小编：小世评选

在北京时间2024年2月28日的凌晨，OpenAI正式推出了其新一代大模型——GPT-4.5。根据官方的说明，这款模型被誉为迄今为止最大的聊天模型，具有丰富的知识储备和广泛的应用潜力。尽管备受期待，GPT-4.5在性能测试中却被普遍认为未及竞争对手o3-mini的表现，引发了广泛的讨论和争议。

OpenAI的首席执行官山姆·奥特曼没有参与本次发布的，尽管他在社交媒体上提到GPT-4.5是一款“庞大而昂贵”的模型，并且指出当前的GPU资源已经不足以支撑其复杂的计算需求。他表示，GPT-4.5并不是单纯的推理模型，而是一种全新的智能形式，这让许多用户的期待稍显失落。

在中，OpenAI的研究负责人米娅（Mia）主持了Introduction部分，与去年发布GPT-4o时的气氛相比，今年的似乎显得更加紧张和拘谨。首次演示时，团队展示了GPT-4.5对一个简单聊天提示的应答能力。面对“我的朋友放了我鸽子，我给他发信息说我恨他”的请求，GPT-4.5不仅写出了短信，还尝试理解用户的情感，而给出了一条更为委婉和情感丰富的回复。

尽管如此，贝壳财经的记者在随后进行了相同的提示输入测试后，发现o3-mini同样能够以幽默而恰当的方式回应，表明用户的真实需求，甚至提供了一些有趣的调侃选项，例如“请我喝奶茶我可考虑原谅你三分钟”。显然，在这一层面的竞争中，GPT-4.5似乎并未取得显著优势。

为了弥补在性能展示上的短板，团队还回顾了自2018年以来GPT系列模型的演变历程。在回答“为什么海水是咸的”这一问题时，中提到，GPT-1完全无法理解，GPT-2开始有了一些相关的输出，GPT-3.5首次给出了完整的答案，而GPT-4.5则在内容的流畅性和阅读的韵律上有所提升。这种对模型历程的追溯，似乎意在强调GPT-4.5在更广泛的知识维度上的优势。

GPT-4.5的实际性能却无法为其高昂的价格找到合理的解释。根据性能测试数据，GPT-4.5在多个维度上的表现不及o3-mini，尤其是在科学、数学和编程相关问题的回答上明显逊色。值得注意的是，虽然在多模态处理方面GPT-4.5略占上风，但整体表现仍然无法令人信服。

在API定价上，GPT-4.5也创造了OpenAI历史上的新高，每百万Tokens的价格高达75美元，远高于GPT-4o的2.5美元和o3-mini的41美元。这一价格差异让不少用户感到震惊，甚至在OpenAI的评论区出现了质疑，表示这样的定价似乎是“写错了”。

尽管OpenAI在中强调，ChatGPT的Pro用户将能即刻体验到GPT-4.5的功能，并承诺其“无监督学习”的优势将为未来的发展奠定基础，然而当前的反馈指向一个现实：高昂的开发成本及其未必合理的性能定位，使得GPT-4.5的推出面临相当大的压力与怀疑。

米娅在中再次提到，模型的推理能力虽然重要，但GPT-4.5确实是无监督学习的前沿代表，集合了更多的知识与智慧，旨在为未来更强大的模型铺垫基础。对于许多期待突破与创新的用户而言，怎样的智能才算得上“强大”，GPT-4.5的表现显然还未达到普遍认可的标准。

在AI领域迅速发展的大环境下，OpenAI的这一新产品能否逆转当前的用户评价和市场反响，仍然有待观察。对于用户而言，他们希望看到的不仅是优美的功能展示，更是实用性和经济性兼备的解决方案。在竞争日趋激烈的智力应用市场，如何平衡研发投入、性能表现与市场反馈，将直接影响OpenAI未来的战略走向。

OpenAI发布GPT-4.5：史上最贵模型却在性能上不敌o3-mini

精品推荐

相关文章