OpenAI发布GPT-4.5：情商提升但成本飙升，进步有限引发热议

时间：2025-03-01 05:10

小编：小世评选

OpenAI于北京时间2023年2月28日发布了备受瞩目的GPT-4.5（研究预览版），虽然市场对其充满期待，但发布会形式显得有些简单，CEO山姆·奥特曼并未亲自出席，官方向公众明确表示，GPT-4.5并不是一个前沿的创新模型。从两年前隆重发布的GPT-4相比，这一场面显得平淡。这一切预示着，尽管GPT-4.5在技术上有所进步，但在实际应用和成本控制上似乎并不尽如人意。

GPT-4.5的情感智能显著提升，能更好地理解用户需求。在对话中，当用户表达情绪时，模型能够及时返回更具建设性的反馈。例如，在用户提及朋友失约时，GPT-4.5并未满足于提供一条愤怒的短信，而是提供了一些更加应景的建议，通过这种方式，模型展现了更高的情感洞察力。当用户表达对考试失败的沮丧时，GPT-4.5不仅提供解决方案，还主动关心用户的情绪状态，这正是其情感智能提升的体现。

GPT-4.5的推出并非没有代价。其使用成本的飞速上涨引发了广泛的争议。根据公开数据，GPT-4.5的API定价极其高昂，输入（缓存未命中）为75美元/百万tokens，输出则为150美元/百万tokens。这一价格足足是GPT-4o的30倍，是同类模型DeepSeek-V3的277倍，甚至在促销时，GPT-4.5的价格达到DeepSeek的555倍。这使得许多潜在用户和开发者对其可持续性产生了疑虑。

相较于这种高昂的运维成本，GPT-4.5的实际性能提升似乎并扣人心弦。据内部测试数据显示，GPT-4.5在基础的MMMLU（语言理解）和MMMU（多模态）测试中的成绩提升幅度仅在5%左右。在某些科学问答的基准测试中，GPT-4.5的表现甚至不如推理模型o3-mini。这种现象也让人们开始质疑，OpenAI是否在追求情感智能的提升时，忽视了核心推理能力的强化。

值得注意的是，尽管在模型的整体智商提升上并不显著，但幻觉的产生率却有了显著减少。在SimpleQA这类常识问答测试中，GPT-4.5编造答案或出现幻觉的比例约为37%，而GPT-4o这一比例接近60%。这一变化显然是用户所期待的，因为在实际应用中，幻觉问题是一大痛点，减少幻觉产生的能力能让用户更为信赖模型的回答。

OpenAI对此次发布的背景也有一定的解释。相较于主打推理能力的其他模型，GPT-4.5采取的是非推理路线。虽然未来的模型发展可能会在预训练与推理之间寻求更好的平衡，但从当前发布的数据来看，GPT-4.5似乎难以令用户满意。正如某商业客户模型服务公司的CTO所言，GPT-4.5在交互上尽管更加顺滑，但整体而言并没有带来根本性的变革。可以说，GPT-4.5更像是一种“半代升级”，并未能切实解决用户在使用时遇到的实际问题。

OpenAI在发布后的评论中表示，GPT-4.5的训练成本同样不容忽视，预计还需要增补大量的GPU资源来保证继续开发。这也进一步凸显了当前市场对高性能、大规模模型的需求。随着DeepSeek等竞争对手的崛起，OpenAI不得不重新审视其产品线和定价策略。

GPT-4.5在情感智能上确实有所提升，而对幻觉的减少也为用户解除了一部分的疑虑。这一切的代价显然不低，庞大的使用成本令许多用户望而却步。在这样的背景下，用户可能更青睐于如ChatGPT的会员服务，作为一种相对性价比高的使用方式。

，尽管OpenAI在发展上遭遇了一些挑战，但仍然有望通过技术创新与市场调整来实现突破。尽管的GPT-4.5是一个值得体验的模型，但是否会成为用户长期订阅的理由，还需要观察其在实际应用中的表现。未来的市场竞争将更加激烈，OpenAI是否能抓住机遇，实现用户的长期认可，我们拭目以待。

OpenAI发布GPT-4.5：情商提升但成本飙升，进步有限引发热议

精品推荐

相关文章