智谱科技发布全球首个回车即用智能体GLM-PC,AI技术再创新高
时间:2025-01-23 22:50
小编:小世评选
编辑:编辑部 HYZ
在人工智能技术飞速发展的今天,智谱科技日前发布了全球首个面向公众且可“回车即用”的电脑智能体——GLM-PC(小名“牛牛”)。这一创举不仅标志着AI技术的一次重大突破,也使智谱科技在智能体领域抢先一步,迈入了L3级的工具使用能力。
在即将到来的春节,大家在微信上发送拜年祝福已经成为一种习俗。而GLM-PC的到来,让这一过程变得更加轻松和高效。想象一下,你只需要上传一张带有祝福信息的图片,再给出指令“识别图片中的信息生成朋友圈文案并发送”,GLM-PC便能快速将任务逐步完成。不仅识别图片内容,还能自动生成文案,一键发送至朋友圈,简直让人惊叹。
GLM-PC的发布,在去年11月便已引起热议,经过升级的v1.1版本,具备了类似人类的观察与操作能力,可以自主完成复杂任务。更关键的是,GLM-PC新增了“深度思考”模式和逻辑推理及代码生成功能,使其在处理多样化任务方面更为突出。
智谱科技在智能体研发上的布局可追溯至公司成立之初。以GLM-PC为核心,智谱推出了覆盖手机和电脑端的智能体系统,包括手机智能体AutoGLM和电脑智能体GLM-PC。AutoGLM专注于进入移动设备,为用户提供跨场景的智能交互体验,而GLM-PC则是进一步提升了桌面端的操作,以VLM(视觉语言模型)为基础,构建出兼具逻辑推理与感知认知的新型智能体。
在2025年,即将成为智能体的“元年”。OpenAI早已透露其AGI(通用人工智能)实现路线图,现阶段的进展已经达到L2级,将向L3级自主AI智能体迈进。智谱科技独具前瞻性的技术蓝图,使其在智能体领域逐渐展现领先优势。智谱的目标是在未来五年内将AI能力从L1逐步提升至L5,预示着一场智能革命的来临。
智谱科技的CEO张鹏在Agent OpenDay中明确指出,当前的LLM(大语言模型)已经初步具备了与现实物理世界互动的能力。未来,智谱的智能体将不断优化工具使用能力,并探索自我学习的L4阶段。通过创新的左右脑思维模型,GLM-PC不仅能处理复杂的逻辑任务,更在应对开放性问题时展现出强大的适应能力和创造力。
GLM-PC的“左脑”负责逻辑推理、任务规划和执行。它能够帮助用户将大型任务拆解为小步骤,并生成清晰的执行路径。例如,假设你打算采购春节年货,只需将相关商品的图片链接提供给GLM-PC,它便会自动提取信息并创建Excel文件,将商品信息加入购物车,一气呵成,无需用户手动操作。
GLM-PC的“右脑”则在图像理解和用户行为分析中发挥了重要作用。它能够理解用户需求,通过与用户的自然交流,进行信息提取并执行相关任务。在上班期间,用户可以直接告诉GLM-PC搜索“春节贺岁档电影”,并将相关信息发送至微信群,省去繁琐的操作。
有趣的是,GLM-PC还具有实时动态调整的能力。在执行任务时,它能够根据环境反馈进行自我修正与优化。这一特性使其在处理复杂任务时,具有更高的灵活性和准确性。例如,用户要求GLM-PC在小红书中搜索信息并与朋友分享,智能体能快速反应并完成任务,不断学习和适应。
GLM-PC背后的技术支持是智谱自主研发的多模态智能体CogAgent和代码模型CodeGeex。通过这些技术,GLM-PC能够在多和多任务之间稳定且高效地完成复杂场景下的操作。智谱科技近期推出的CogAgent-9B-20241220版本,进一步提升了智能体的性能,使其获得在多任务环境下的最佳表现。
展望未来,GLM-PC将与AIPC(智能个人计算中心)深度融合,推动个人计算和智能体应用的创新。智谱科技正在与联想、华硕等知名PC厂商展开合作,共同开发出更为智能化的个人电脑,使其能够全面理解用户意图,并提供7x24小时高效的智能支持。
GLM-PC的推出不仅让智能体技术向前迈进了一大步,更是打开了一个崭新的智能未来。无论是在工作中,还是日常生活里,GLM-PC都将成为用户得力的助手,帮助他们简化复杂任务,提升工作效率。此刻,我们正站在这场智能革命的最前沿,期待在不久的将来,智能科技为我们的生活带来更多便利与惊喜。