OpenAI发布GPT-4.5:情商提升与更深刻理解能力引关注,API定价引发讨论
时间:2025-02-28 15:40
小编:小世评选
日前,OpenAI正式发布了其最新的聊天模型GPT-4.5,这一消息在技术界和公众中引发了广泛关注。与以往的版本不同,这一次发布会并没有展现令人印象深刻的解题能力或耀眼的排行榜,而是强调了情感智能和更深入的理解能力。虽然在发布会中未见奥特曼的身影,但这一新模型的推出是一次技术上的飞跃。
在第一次现场演示中,用户诉说着因朋友爽约而产生的烦恼,要求GPT-4.5帮忙撰写一条短信以表达对朋友的“愤怒”。GPT-4.5的回应并没有简单地满足用户的请求,反而意识到这样的表达可能会破坏友谊,因此建议用户更清晰地传达自己的情感,并提供了多种备选方案。这种互动方式使得整个对话变得更加自然和贴心,超越了单纯的指令执行。
在展示如何解释海水为何咸的问题时,GPT-4.5的处理方式同样令人称道。相较于之前的模型,这款新模型能以一种更互动、更容易被用户理解的方式传递知识,强调三个关键词的简洁开场,从而使用户更容易记住要点。同时,面对更复杂的议题,比如“用第一性原理解释AI对齐的必要性”,GPT-4.5不仅给出了明确的方向,还通过步骤引导用户思考。这一方法与传统的直接聊天方式截然不同,展现了其良好的引导和交互能力。
除了现场演示,OpenAI还分享了一些技术开发内幕,透露在预训练阶段运用了许多“激进”的方法,使得GPT-4.5在计算效率上比其前身GPT-4提升了十倍以上。根据技术报告显示,这并非一个前沿模型,但它的能力通过扩展无监督学习、推理和架构优化得到了显著提升,其知识覆盖面更广,理解深度更深,同时幻觉现象显著减少。
在实际评估中,GPT-4.5在对事实准确性的SimpleQA基准测试中获得了62.5%的准确率,光环率则降至37.1%。这表明它在信息传达和理解方面都有了明显改进。例如,当被询问“第一种语言是什么”时,GPT-4.5能够诚实地表示不知道,而不是随意给出一个错误的答案。新的可扩展技术使它能够利用小型模型衍生的数据来训练更大的模型,进而提升了它对细微差别的理解能力以及自然对话的流畅性。
在很多测试中,人类评估者更倾向于选择GPT-4.5而非之前的GPT-4o,显然后者在情感解读和人文理解上存在不足。相较之下,GPT-4.5在与人类进行互动时,能够更加贴心地理解用户的意图,展现出更细腻的“情商”,应对诸如“考试不及格,我很难过”的情绪表达时,它能给予安慰和鼓励,而GPT-4o的回答则显得相对冷漠。
在标准学术基准测试中,GPT-4.5也全面超越了GPT-4o,尤其在程序设计和多语言处理等领域的表现引人瞩目。不过,其API的定价问题引起了不少讨论。具体GPT-4.5的API定价为输入75美元/百万tokens,输出150美元/百万tokens,相比于以前的版本,价格高出了15至30倍,这让许多潜在用户感到不知所措。究竟这个价格是否值得,引起了不少人的讨论。
值得注意的是,尽管价格不菲,但许多使用体验过的用户反馈非常积极,认为GPT-4.5在创造力和人文学科理解上都有显著提升。有博主甚至称,GPT-4.5在视觉理解上表现出色,能巧妙识别出复杂图像中的细节,显示出极大的智能潜力。
,许多人可能会问,奥特曼在这一重磅发布中为何缺席。原来,他最近刚喜得一子,目前正在医院照顾小孩。对于这一新技术的发布,期待未来更多的实测结果能够揭示更多惊喜。
通过GPT-4.5的发布,OpenAI再次证明了其在人工智能领域的领导地位。随着技术的不断进步,未来会有更多的AI应用,以满足用户多样化的需求。感知情感、理解意图,GPT-4.5正是在这条路上又向前迈出了一大步。在不久的将来,它将如何改变我们的生活和工作方式,让我们拭目以待。