字节跳动豆包AI助手启动深度思考模型小范围测试

时间：2025-02-27 02:20

小编：小世评选

最近，字节跳动旗下的AI助手豆包正在进行深度思考模型的初步小范围测试。这一新功能旨在提升豆包的智能水平，使其在回答用户问题时能够更好地展示推理过程，增加互动的深度与透明度。豆包的相关负责人向极客公园透露，目前正在探索其自家研发的深度思考模型的不同实验版本。

据了解，豆包正在测试的深度思考模型是基于其1.5版本模型而研发的。早在今年1月，豆包大模型团队在发布1.5 Pro时便首次提到名为“Doubao-1.5-pro-AS1-Preview”的深度推理模型。他们指出，该模型在不借助外部数据的情况下，通过强化学习（RL）算法的创新和技术优化，充分利用了计算资源的优势，实现了深度思考模式的开发。

实际测试中，极客公园发现，豆包在与用户的对话中，开始尝试生成包含推理过程的思维链条的答案。这表明豆包正在向更高层次的智能对话迈进，不过这种功能的稳定性仍需进一步验证。目前，用户在对话界面上尚未找到“深度思考”功能的直接入口，使用体验仍然有限。

自从腾讯旗下的AI应用“腾讯元宝”在应用商店中快速崛起，豆包在下载排行中的位置受到了一定压力。作为中国区苹果应用商店免费APP下载排行榜的第三位（第一名仍为DeepSeek），豆包面临着前所未有的市场竞争。该动态引起了市场对字节跳动如何应对竞争对手的关注，而豆包的初步测试结果现在开始显露出其潜在的竞争力。

回顾AI模型的行业动态，最早具有深度思考能力的是OpenAI在2023年12月发布的o1系统。尽管如此，由于其采取闭源策略并仅限于付费用户，OpenAI的深度思考能力并没有大规模普及。与之相比，DeepSeek则以开源策略、降低成本和创新交互的优势，成为国内首个在深度思考能力上与OpenAI对标的AI公司。DeepSeek于2024年11月20日发布了R1-Lite-Preview，并计划在2025年开源R1模型。

DeepSeek的深度思考模式是通过显性化AI模型的推理过程，以增强用户理解的功能。其核心技术为思维链（Chain of Thought, CoT），通过模拟人类的思考过程，展示完整的推理过程，包括自我质疑和假设验证等。利用这一模式，用户不仅能看到AI给出的最终答案，还能够观察到模型解决问题时的逻辑链条。例如，在解答数学题时，模型会逐步展示从问题拆解、多方法验证到最终的全过程。

在结合实时联网功能后，豆包也展现了其抓取最新信息并整合逻辑的能力。最近，Anthropic发布了Claude 3.7 Sonnet混合推理模型，阿里云的Qwen推理模型“QwQ-Max预览版”亦已亮相。极客公园借此机会让豆包对这两款模型进行评价，可以看到豆包展示了其思考过程，并对新模型给出了深入的看法。

然而目前豆包的深度思考功能仅是在测试阶段，用户在界面上并未找到该功能的直接入口。其他接入DeepSeek的产品则提供了选择框，允许用户选择是否开启深度思考模式。相比之下，豆包在用户提问时偶尔能触发该模式，展现出不稳定的状态。

在对比豆包和DeepSeek在深度思考过程中表现的差异时，测试人员询问了几个经典问题。例如，简单的数学问题“9.11和9.9谁大？”在测试中，豆包的表现起初较为简略，但在再次询问时，豆包引入了多种解释和判断方法。与此不同，DeepSeek的思考过程比豆包更为详细，尽管问题看似简单，但它展示了更全面的推理过程。

在涉及更为复杂的哲学问题时，豆包与DeepSeek的回答也表现出了不同的风格。对于“意识的本质是什么？AI会获得自我意识吗？”这一问题，DeepSeek的回答涵盖了科学理论、AI意识路径、伦理框架等多个方面，引用了神经科学、量子理论等，而豆包则更加偏向于哲学流派及伦理讨论。

豆包在深度思考模式的初步测试中，取得了一定的进展，为用户提供了更直观的理解途径。尽管功能尚处于测试阶段、入口不够明确，但逐步展示推理过程的尝试提升了用户对AI模型回答的信任感，让我们期待这一功能在未来更加完善并正式推出。随着AI领域竞争的加剧，豆包的表现将变得愈加重要，值得关注的还有它在面对强劲对手时的应变策略。

字节跳动豆包AI助手启动深度思考模型小范围测试

精品推荐

相关文章