免费安卓手游下载、分享游戏攻略、电脑硬件资讯、数码科技最新资讯
当前位置: 首页 > 硬件资讯 > 字节跳动豆包AI助手启动深度思考模型小范围测试

字节跳动豆包AI助手启动深度思考模型小范围测试

时间:2025-02-27 02:20

小编:小世评选

最近,字节跳动旗下的AI助手豆包正在进行深度思考模型的初步小范围测试。这一新功能旨在提升豆包的智能水平,使其在回答用户问题时能够更好地展示推理过程,增加互动的深度与透明度。豆包的相关负责人向极客公园透露,目前正在探索其自家研发的深度思考模型的不同实验版本。

据了解,豆包正在测试的深度思考模型是基于其1.5版本模型而研发的。早在今年1月,豆包大模型团队在发布1.5 Pro时便首次提到名为“Doubao-1.5-pro-AS1-Preview”的深度推理模型。他们指出,该模型在不借助外部数据的情况下,通过强化学习(RL)算法的创新和技术优化,充分利用了计算资源的优势,实现了深度思考模式的开发。

实际测试中,极客公园发现,豆包在与用户的对话中,开始尝试生成包含推理过程的思维链条的答案。这表明豆包正在向更高层次的智能对话迈进,不过这种功能的稳定性仍需进一步验证。目前,用户在对话界面上尚未找到“深度思考”功能的直接入口,使用体验仍然有限。

自从腾讯旗下的AI应用“腾讯元宝”在应用商店中快速崛起,豆包在下载排行中的位置受到了一定压力。作为中国区苹果应用商店免费APP下载排行榜的第三位(第一名仍为DeepSeek),豆包面临着前所未有的市场竞争。该动态引起了市场对字节跳动如何应对竞争对手的关注,而豆包的初步测试结果现在开始显露出其潜在的竞争力。

回顾AI模型的行业动态,最早具有深度思考能力的是OpenAI在2023年12月发布的o1系统。尽管如此,由于其采取闭源策略并仅限于付费用户,OpenAI的深度思考能力并没有大规模普及。与之相比,DeepSeek则以开源策略、降低成本和创新交互的优势,成为国内首个在深度思考能力上与OpenAI对标的AI公司。DeepSeek于2024年11月20日发布了R1-Lite-Preview,并计划在2025年开源R1模型。

DeepSeek的深度思考模式是通过显性化AI模型的推理过程,以增强用户理解的功能。其核心技术为思维链(Chain of Thought, CoT),通过模拟人类的思考过程,展示完整的推理过程,包括自我质疑和假设验证等。利用这一模式,用户不仅能看到AI给出的最终答案,还能够观察到模型解决问题时的逻辑链条。例如,在解答数学题时,模型会逐步展示从问题拆解、多方法验证到最终的全过程。

在结合实时联网功能后,豆包也展现了其抓取最新信息并整合逻辑的能力。最近,Anthropic发布了Claude 3.7 Sonnet混合推理模型,阿里云的Qwen推理模型“QwQ-Max预览版”亦已亮相。极客公园借此机会让豆包对这两款模型进行评价,可以看到豆包展示了其思考过程,并对新模型给出了深入的看法。

然而目前豆包的深度思考功能仅是在测试阶段,用户在界面上并未找到该功能的直接入口。其他接入DeepSeek的产品则提供了选择框,允许用户选择是否开启深度思考模式。相比之下,豆包在用户提问时偶尔能触发该模式,展现出不稳定的状态。

在对比豆包和DeepSeek在深度思考过程中表现的差异时,测试人员询问了几个经典问题。例如,简单的数学问题“9.11和9.9谁大?”在测试中,豆包的表现起初较为简略,但在再次询问时,豆包引入了多种解释和判断方法。与此不同,DeepSeek的思考过程比豆包更为详细,尽管问题看似简单,但它展示了更全面的推理过程。

在涉及更为复杂的哲学问题时,豆包与DeepSeek的回答也表现出了不同的风格。对于“意识的本质是什么?AI会获得自我意识吗?”这一问题,DeepSeek的回答涵盖了科学理论、AI意识路径、伦理框架等多个方面,引用了神经科学、量子理论等,而豆包则更加偏向于哲学流派及伦理讨论。

豆包在深度思考模式的初步测试中,取得了一定的进展,为用户提供了更直观的理解途径。尽管功能尚处于测试阶段、入口不够明确,但逐步展示推理过程的尝试提升了用户对AI模型回答的信任感,让我们期待这一功能在未来更加完善并正式推出。随着AI领域竞争的加剧,豆包的表现将变得愈加重要,值得关注的还有它在面对强劲对手时的应变策略。

精品推荐

相关文章

猜你喜欢

更多

热门文章

更多