OpenAI发布新一代高效模型o3-mini,提升STEM领域推理能力
时间:2025-02-01 15:10
小编:小世评选
作者:何浩
来源:硬AI
在全球人工智能竞争愈发激烈的背景下,OpenAI于当地时间1月31日正式发布了其最新的一代高效模型o3-mini。这一模型在ChatGPT以及API中已经全面上线,备受业内瞩目。随着开源模型DeepSeek的发布,OpenAI的o3-mini被认为是回应市场竞争的一项重要举措。
o3-mini的设计旨在以更低的成本和更快的响应速度提供更为出色的STEM能力,特别是在科学、数学和编程领域展示了显著优势。与之前的o1-mini版本相比,o3-mini不仅延续了低成本和低延迟的特点,还针对技术领域提供了更专门的解决方案。OpenAI允许开发者根据不同的需求选择低、中、高三个“推理努力”选项,使其在速度与准确性之间找到平衡。
OpenAI强调,o1-mini仍然作为广泛适用于一般知识推理的模型,而o3-mini则为需要精准和快速响应的技术应用提供了一种替代方案。中等推理努力的设置可以使o3-mini在两者间游刃有余,进行高效决策。
为了提升开发者的使用体验,o3-mini新增了多个功能,包括:
函数调用:开发者可以直接调用预设的函数,这极大提高了任务处理的效率;
结构化输出:模型输出的信息更加规整,方便后续的数据解析和应用;
开发者消息:为开发者提供更多调试与信息反馈手段,增强交互性。
与o1-mini一样,o3-mini也支持流式输出,这种设计使其在处理复杂问题时能够更高效地进行思考,而在面对简单问题时则更注重快速响应。值得注意的是,o3-mini不支持视觉处理功能,用户在进行图像相关的任务时仍需依赖于o1模型。
o3-mini的接入方式十分多样,满足不同用户的需求:
API用户:o3-mini已向部分API用户开放,适用于使用层级在3-5的用户,涵盖了Chat Completions、Assistants和Batch API等领域。
ChatGPT用户:ChatGPT Plus、Team和Pro用户从发布当周起便可使用,企业用户则将在一周后获得访问权限。
免费用户:此次o3-mini的发布特别之处在于,免费用户也能通过选择“推理模式”或重新生成回答体验这一具备推理能力的模型,这是首次为免费用户提供这样高级的功能。
OpenAI还宣布,o3-mini将取代模型选择器中的o1-mini,另一方面,Plus和Team用户的消息限额也从o1-mini的50条提高到o3-mini的150条。OpenAI正在进行早期原型的开发,未来还将支持用户查找最新答案并提供相关网页链接。
在性能方面,OpenAI公布了o3-mini在多个测试中的表现,例如在2024年美国数学邀请赛(AIME 2024)中,使用低推理努力的o3-mini准确率为60%,这一成绩与o1-mini相当,但响应速度更快。中等推理努力时,其准确率提升至79.6%,与o1模型持平。在FrontierMath等编程竞赛方面,o3-mini的成绩则显示出明显优势。
OpenAI同样关注安全性与风险防控,o3-mini采用了“深思熟虑的对齐”方法,在回答用户问题之前,模型会思考和遵守人类制定的安全规则。o3-mini在面对复杂的安全挑战时表现得更加出色,而这些改进则是在充分评估各种风险并进行外部红队测评的基础上实现的。
展望未来,OpenAI希望通过o3-mini的推出,使得高质量的人工智能能够更好地为STEM领域服务。新模型不仅传承了OpenAI在降低人工智能使用成本方面的努力,也保证了顶级的推理能力。自GPT-4推出以来,每个token的定价已下降了95%,这在一定程度上使得庞大的用户群体能够轻松接触到优质的AI工具。
o3-mini的发布背景亦显得尤为重要。在OpenAI宣布Operator AI代理后不久,特朗普推出了庞大的“星际之门”AI资助项目。紧DeepSeek R1等开源模型的面世震惊了市场,促使OpenAI加快了o3-mini的发布步伐,以巩固其在全球人工智能领域的领先地位。
o3-mini的推出标志着OpenAI在推理模型领域的重要一次进步,它不仅满足了技术领域对快速与精确的要求,还在多方面为开发者提供了便利。随着人工智能技术的不断演进,OpenAI正积极推动行业向前发展,力求在创新、效率与安全之间找到最佳平衡。随着o3-mini的广泛应用,未来期待看到其在更多领域带来的积极影响。