硅谷掀起代理式人工智能热潮,2025年将迎首批AI智能体入职
时间:2025-01-20 19:30
小编:小世评选
近年来,AI智能体迅速成为科技界的关注焦点。包括Google DeepMind、OpenAI及Anthropic在内的一众科技巨头正在积极研发代理式人工智能(Agentic AI),致力于赋予大型语言模型(LLM)自主完成各项任务的能力。这一方向的探索引发了行业内的广泛讨论,硅谷的公司们纷纷考虑如何利用这项新技术来重塑行业格局。
OpenAI的首席执行官Sam Altman上周曾在博客中指出:“我们相信,2025年首批AI智能体将可能踏入职场,并将实质性地改变企业的生产力。”这一言论激发了对未来AI应用潜力的热烈预期。
AI智能体在广义上是一种能够自主执行任务的软件系统,这些系统通常只需极少甚至完全不需人工监督。任务的复杂性和技术的先进性直接决定了智能体的能力。现今的LLM已经足够智能,能够驱动智能体执行多项实用任务,例如填写表格、查找食谱并将所需食材添加到购物车,或在会议前快速进行背景研究并生成要点。
在今年10月,Anthropic展示了一项名为“Computer Use”的AI智能体扩展功能。凭借这项技术,用户能够像指挥人类一样,通过命令Claude在计算机上移动光标、点击按钮和输入文本。这一功能的实现标志着AI智能体在交互和自主操作方面的重要一步,虽然目前仍存在一些繁琐和错误问题,但已向部分测试人员开放,包括来自DoorDash、Canva和Asana等公司的开发者。
对于这一技术的未来发展,MIT Technology Review近期采访了Anthropic的联合创始人兼首席科学家Jared Kaplan。他提出,从两个主要维度可以理解AI智能体的能力:一是完成任务的复杂程度,二是AI所能利用的环境或工具种类。Kaplan强调,随着AI在文本、多模态模型及“Computer Use”等功能方面的进步,智能体将不断扩展其应用范围,变得更加实用。
Kaplan举例回顾了DeepMind的围棋模型AlphaGo,该系统在下棋方面超越人类,但如果其能力仅限于棋盘游戏,现实应用前景却相对狭隘。他指出,AI智能体的发展需关注其在多样化环境中的应用,尤其是随着新技术的不断涌现,未来的智能体能够更灵活地应对复杂的实际情况。
“目前‘Computer Use’功能的推出,正在帮助AI模型提升完成复杂任务的能力。”Kaplan补充说,AI也将在识别自身错误和寻求用户反馈方面变得更加智能。这种能力的提升意味着智能体不仅能更准确地完成任务,还能在必要情况下进行合理推理。
Kaplan还谈到,AI智能体对于用户的特定需求和工作环境的理解至关重要。他认为,随着时间的推移,Claude等系统将能够更深入地理解用户的需求,并从文档和沟通工具(如Slack)中学习,从而有效避免人为错误,并精准完成任务。
在开发的过程中,Kaplan透露,Anthropic将向开发者提供“Computer Use”功能的测试版本,以便收集用户反馈,并计划在系统不断完善后将其推广到更广泛的用户群体。而像DoorDash、Browser Company和Canva等公司正尝试结合AI技术探索不同的浏览器交互,为用户带来更流畅的操作体验。
同时,Kaplan也表达了对未来代码助手的期待。他指出,在开发者领域,使用Claude进行编程的热度不断上升,这已不仅限于自动补全,而是能够理解并调试代码,探索代码的执行情况并进行修复。
不过,随着AI技术的飞速发展,安全性问题也愈加紧迫。Kaplan强调,Anthropic成立的初衷,是为应对AI技术快速进步所带来的安全挑战。他指出,“提示词注入”是一种潜在攻击方式,尤其在广泛应用“Computer Use”功能后,这类问题将需要特别关注。对此,Kaplan表示,Anthropic正在积极寻求防范措施,以确保AI智能体不会被恶意利用。
“虽然挑战很多,但我对AI的实际应用充满期待,尤其是其在提升工作效率方面的潜力。”Kaplan表示,AI智能体的进入将给各行业带来新的机遇和变化,2023年是一个充满挑战与希望的年份。
在未来的岁月里,我们将见证AI智能体如何改变我们的工作方式,并期待其在多领域的创新应用,将人工智能的潜力发挥到极致。