OpenAI发布GPT-4.5:情商提升但成本飙升,进步有限引发热议
时间:2025-03-01 05:10
小编:小世评选
OpenAI于北京时间2023年2月28日发布了备受瞩目的GPT-4.5(研究预览版),虽然市场对其充满期待,但发布会形式显得有些简单,CEO山姆·奥特曼并未亲自出席,官方向公众明确表示,GPT-4.5并不是一个前沿的创新模型。从两年前隆重发布的GPT-4相比,这一场面显得平淡。这一切预示着,尽管GPT-4.5在技术上有所进步,但在实际应用和成本控制上似乎并不尽如人意。
GPT-4.5的情感智能显著提升,能更好地理解用户需求。在对话中,当用户表达情绪时,模型能够及时返回更具建设性的反馈。例如,在用户提及朋友失约时,GPT-4.5并未满足于提供一条愤怒的短信,而是提供了一些更加应景的建议,通过这种方式,模型展现了更高的情感洞察力。当用户表达对考试失败的沮丧时,GPT-4.5不仅提供解决方案,还主动关心用户的情绪状态,这正是其情感智能提升的体现。
GPT-4.5的推出并非没有代价。其使用成本的飞速上涨引发了广泛的争议。根据公开数据,GPT-4.5的API定价极其高昂,输入(缓存未命中)为75美元/百万tokens,输出则为150美元/百万tokens。这一价格足足是GPT-4o的30倍,是同类模型DeepSeek-V3的277倍,甚至在促销时,GPT-4.5的价格达到DeepSeek的555倍。这使得许多潜在用户和开发者对其可持续性产生了疑虑。
相较于这种高昂的运维成本,GPT-4.5的实际性能提升似乎并扣人心弦。据内部测试数据显示,GPT-4.5在基础的MMMLU(语言理解)和MMMU(多模态)测试中的成绩提升幅度仅在5%左右。在某些科学问答的基准测试中,GPT-4.5的表现甚至不如推理模型o3-mini。这种现象也让人们开始质疑,OpenAI是否在追求情感智能的提升时,忽视了核心推理能力的强化。
值得注意的是,尽管在模型的整体智商提升上并不显著,但幻觉的产生率却有了显著减少。在SimpleQA这类常识问答测试中,GPT-4.5编造答案或出现幻觉的比例约为37%,而GPT-4o这一比例接近60%。这一变化显然是用户所期待的,因为在实际应用中,幻觉问题是一大痛点,减少幻觉产生的能力能让用户更为信赖模型的回答。
OpenAI对此次发布的背景也有一定的解释。相较于主打推理能力的其他模型,GPT-4.5采取的是非推理路线。虽然未来的模型发展可能会在预训练与推理之间寻求更好的平衡,但从当前发布的数据来看,GPT-4.5似乎难以令用户满意。正如某商业客户模型服务公司的CTO所言,GPT-4.5在交互上尽管更加顺滑,但整体而言并没有带来根本性的变革。可以说,GPT-4.5更像是一种“半代升级”,并未能切实解决用户在使用时遇到的实际问题。
OpenAI在发布后的评论中表示,GPT-4.5的训练成本同样不容忽视,预计还需要增补大量的GPU资源来保证继续开发。这也进一步凸显了当前市场对高性能、大规模模型的需求。随着DeepSeek等竞争对手的崛起,OpenAI不得不重新审视其产品线和定价策略。
GPT-4.5在情感智能上确实有所提升,而对幻觉的减少也为用户解除了一部分的疑虑。这一切的代价显然不低,庞大的使用成本令许多用户望而却步。在这样的背景下,用户可能更青睐于如ChatGPT的会员服务,作为一种相对性价比高的使用方式。
,尽管OpenAI在发展上遭遇了一些挑战,但仍然有望通过技术创新与市场调整来实现突破。尽管的GPT-4.5是一个值得体验的模型,但是否会成为用户长期订阅的理由,还需要观察其在实际应用中的表现。未来的市场竞争将更加激烈,OpenAI是否能抓住机遇,实现用户的长期认可,我们拭目以待。