硅谷掀起代理式人工智能热潮，2025年将迎首批AI智能体入职

时间：2025-01-20 19:30

小编：小世评选

近年来，AI智能体迅速成为科技界的关注焦点。包括Google DeepMind、OpenAI及Anthropic在内的一众科技巨头正在积极研发代理式人工智能（Agentic AI），致力于赋予大型语言模型（LLM）自主完成各项任务的能力。这一方向的探索引发了行业内的广泛讨论，硅谷的公司们纷纷考虑如何利用这项新技术来重塑行业格局。

OpenAI的首席执行官Sam Altman上周曾在博客中指出：“我们相信，2025年首批AI智能体将可能踏入职场，并将实质性地改变企业的生产力。”这一言论激发了对未来AI应用潜力的热烈预期。

AI智能体在广义上是一种能够自主执行任务的软件系统，这些系统通常只需极少甚至完全不需人工监督。任务的复杂性和技术的先进性直接决定了智能体的能力。现今的LLM已经足够智能，能够驱动智能体执行多项实用任务，例如填写表格、查找食谱并将所需食材添加到购物车，或在会议前快速进行背景研究并生成要点。

在今年10月，Anthropic展示了一项名为“Computer Use”的AI智能体扩展功能。凭借这项技术，用户能够像指挥人类一样，通过命令Claude在计算机上移动光标、点击按钮和输入文本。这一功能的实现标志着AI智能体在交互和自主操作方面的重要一步，虽然目前仍存在一些繁琐和错误问题，但已向部分测试人员开放，包括来自DoorDash、Canva和Asana等公司的开发者。

对于这一技术的未来发展，MIT Technology Review近期采访了Anthropic的联合创始人兼首席科学家Jared Kaplan。他提出，从两个主要维度可以理解AI智能体的能力：一是完成任务的复杂程度，二是AI所能利用的环境或工具种类。Kaplan强调，随着AI在文本、多模态模型及“Computer Use”等功能方面的进步，智能体将不断扩展其应用范围，变得更加实用。

Kaplan举例回顾了DeepMind的围棋模型AlphaGo，该系统在下棋方面超越人类，但如果其能力仅限于棋盘游戏，现实应用前景却相对狭隘。他指出，AI智能体的发展需关注其在多样化环境中的应用，尤其是随着新技术的不断涌现，未来的智能体能够更灵活地应对复杂的实际情况。

“目前‘Computer Use’功能的推出，正在帮助AI模型提升完成复杂任务的能力。”Kaplan补充说，AI也将在识别自身错误和寻求用户反馈方面变得更加智能。这种能力的提升意味着智能体不仅能更准确地完成任务，还能在必要情况下进行合理推理。

Kaplan还谈到，AI智能体对于用户的特定需求和工作环境的理解至关重要。他认为，随着时间的推移，Claude等系统将能够更深入地理解用户的需求，并从文档和沟通工具（如Slack）中学习，从而有效避免人为错误，并精准完成任务。

在开发的过程中，Kaplan透露，Anthropic将向开发者提供“Computer Use”功能的测试版本，以便收集用户反馈，并计划在系统不断完善后将其推广到更广泛的用户群体。而像DoorDash、Browser Company和Canva等公司正尝试结合AI技术探索不同的浏览器交互，为用户带来更流畅的操作体验。

同时，Kaplan也表达了对未来代码助手的期待。他指出，在开发者领域，使用Claude进行编程的热度不断上升，这已不仅限于自动补全，而是能够理解并调试代码，探索代码的执行情况并进行修复。

不过，随着AI技术的飞速发展，安全性问题也愈加紧迫。Kaplan强调，Anthropic成立的初衷，是为应对AI技术快速进步所带来的安全挑战。他指出，“提示词注入”是一种潜在攻击方式，尤其在广泛应用“Computer Use”功能后，这类问题将需要特别关注。对此，Kaplan表示，Anthropic正在积极寻求防范措施，以确保AI智能体不会被恶意利用。

“虽然挑战很多，但我对AI的实际应用充满期待，尤其是其在提升工作效率方面的潜力。”Kaplan表示，AI智能体的进入将给各行业带来新的机遇和变化，2023年是一个充满挑战与希望的年份。

在未来的岁月里，我们将见证AI智能体如何改变我们的工作方式，并期待其在多领域的创新应用，将人工智能的潜力发挥到极致。

硅谷掀起代理式人工智能热潮，2025年将迎首批AI智能体入职

精品推荐

相关文章