收录于话题

?类与机器的互动?式正在发?范式转变。这是由于只有对话功能的 Chatbot,正在进化为“有?、有脑、有眼睛”的?主 Agent。

作为最早探索 Agent 的?模型企业之?,智谱今天带来了多个新进展:
? AutoGLM 可以?主执?超过 50 步的?步骤操作,也可以跨 app 执?任务
? AutoGLM开启「全?动」上?新体验,?持等数?个?站的??驾驶
? 像??样操作计算机的GLM-PC 启动内测,基于视觉多模态模型实现通?Agent的技术探索

在 Agent OpenDay 现场,AutoGLM 给在场数百位嘉宾发送了「?个来? AI 的微信红包」,并且?机远程指挥电脑?动发送?件。
人在发布会现场,很荣幸成为200位幸运观众之一。


?智谱 CEO 张鹏需要做的,只是在现场下达?个简单语?指令。这些原本对于机器???常复杂的操作,今天完全由智谱产品化的 Agent 完成。
下?的短?介绍了 Agent 操作?机、电脑,以及?机电脑联动的场景。
?起来看看 agent 如何帮助打??度过「光说不?」的?天。
AutoGLM 新升级:挑战更复杂
新升级的 AutoGLM 可以挑战完成复杂任务:
1. 超?任务:理解超?指令,执?超?任务。例如,在采购?锅?材的例?中,AutoGLM ?主执?了 54步?打断操作。并且,在这种多步、循环任务中,AutoGLM 的速度表现超过??动操作。

2. 跨 app :AutoGLM ?持跨 App 来执?任务。??将习惯于 AI ?动处理,?不是在多个 APP 间来回切换。由于?前 AutoGLM 形态更像是??和应?间的APP执?的调度层,因此跨 App 能?是???常关键的?步。

3. 短?令:AutoGLM 能够?持?任务的?定义短语。今天,你不?再给AutoGLM说:“帮我买?杯瑞幸咖啡,?椰拿铁,五道?店,?杯、热、微糖” 这类超?指令,只需要说“点咖啡”。
4. 随便模式:我们都会陷?选择恐惧,AutoGLM 今天可以主动帮你做出决策。随便模式下所有步骤都让 AI 决策,带来有抽盲盒式的惊喜。想不想尝尝AI为你点的咖啡?味?
同时 AutoGLM 启动?规模内测,并将尽快上线成为?向 C 端??的产品。 AutoGLM 同时宣布启动 [10个亿级 APP 免费 Auto 升级」的计划,邀请 App 伙伴联合探索??的 Auto 新场景。

?持核?场景和核?应?的 AutoGLM 标品 API,会在两周内上线到智谱maas开放平台(bigmodel.cn)试?。Web 端开启「全?动」上?新体验:即?起智谱清?插件上线 AutoGLM 功能,?持搜索、微博、知乎、Github 等数?个?站的??驾驶。
GLM-PC 邀测:?向「??驾驶」电脑的?次技术探索
不只是基于?机和浏览器,今天智谱还带来基于 PC 的?主Agent。GLM-PC 是 GLM 团队?向「??驾 驶」PC的?次技术探索,基于智谱的多模态模型 CogAgent。

?前开放第?阶段的内测场景,包括:
- 会议替?:帮??预定和参与会议,发送会议总结。
- ?档处理:?持?档下载、?档发送、理解和总结?档。
- ??搜索与总结:在指定平台(如微信公众号、知乎、?红书等)搜索指定关键词,完成阅读、总结。
- 远程和定时操作:远程?机发指令,GLM-PC 可以?主完成电脑操作;设定?个未来时间,在开机状态下定时执?任务。
- 隐形屏幕:在???作时,GLM-PC 可以在隐形屏幕上?主完成?作,解放屏幕使?权。

??电脑的过程??眼看图形及?字,?脑规划,再??执?单击双击、输?等操作。GLM-PC ?电脑的?式?乎完全和??样。也正因如此,理论上只要是为?类设计的应?,在GLM-PC学习之后它都能够执?。这是?种系统级、跨平台的能?,不依赖于 HTML、API,具备更?的能?上限。
AutoGLM和GLM-PC是智谱AI迈向AI智能操作系统的重要尝试。它们的出现源于智谱在?语?模型、多模
态模型、逻辑推理和?具使?等??的技术积累。从23年4?的AgentBench开始,到8?的CogAgent
模型,智谱针对AutoGLM,和GLM-PC的模型CogAgent的研发?作进?了?年半的时间。
与 OpenAI 有所不同,智谱定义了?模型发展的五个阶段:L1 语?能?、L2 逻辑能?(多模态能?)、L3 使??具的能?、 L4 ?我学习能?、 L5 探究科学规律。

发展?今,?模型已经初步具备了?类与现实物理世界互动的部分能?。“Agent 将极?地提升 L3 使??具能?,同时开启对 L4 ?我学习能?的探索。” 张鹏说。张鹏表?,未来 GLM 团队将继续加速 agent 模型产品的研发,期待着?句话操作电脑和?机的范式尽快到来。
?模型从 Chat ?向 Act
如今,?模型技术正在改变机器和?的互动?式,基于理解需求、规划与决策、执??动和?我反思,Agent 将带来符合直觉的?机交互?从?适应机器,到让机器适应?。

苹果(Apple Intelligence)、Anthropic(Computer Use)、?歌(Jarvis)和 OpenAI (Operator)等企业也已经把 Agent 作为 2025 年的主要关注点。业内普遍认为,2025 年将是 Agent 爆发之年。Gartner 近期将 agentic AI 列为 2025 年??技术趋势之?,并预测 2028 年?少有 15% 的
?常?作决策将由 agentic AI ?主完成,?这?数字在 2024 年为 0。

与 GenAI 不同,Agent 是?标驱动型的,能够完全执??作流程,适应、学习、迭代、与其他系统和?类协作,并端到端地完成任务。在张鹏看来,Agent 可以看作是?模型通?操作系统 LLM-OS 的雏形。
“现阶段,AutoGLM 相当于在?与应?之间添加?个执?的调度层,很?程度上改变?机的交互形式。更重要的是,我们看到了 LLM-OS 的可能,基于?模型智能能?(从 L1 到 L4 乃?更?),未来有机会实现原?的?机交互。将?机交互范式带向新的阶段。”
?模型和 Agent 的发展不仅为??带来了AI时代智能设备的新范式,更意味着?模型技术更?阔的落地空间。从智能设备?向智能?络,在不久的将来,我们将看到AI原?设备的互联互通和?限可能。
在这个过程中,智谱也将提供?系列的产品和能?,帮助智能设备们拥抱?模型,加速迈向 AI 原?设备新时代。
【我是谁】
绛烨,enfp/infp,AI科技自媒体博主,公众号“AIGC新知”主理人(目前粉丝量10000+)
主业在一家教育公司做AI产品运营兼agent开发。
【我能提供】
(1)公众号文章合作,可友情or付费or资源置换
(2)社群相关资源
(3)AI头部KOL资源
(4)教育/agent开发等方面讨论交流
【我需要】
(1)AI教育相关认知/资源
(2)AI agent开发定制,课程培训合作等。
(3)商务合作可直接联系,期待多多交流,共同进步
加我探讨交流。

知识星球沉淀了很多AI的掘金素材集,欢迎加入!

如果觉得不错,欢迎点赞、在看、转发,您的转发和支持是我不懈创作的动力~
如果想第一时间收到推送,可以给我个星标?~
谢谢你挤出时间看我的文章推送,一眼万年,不胜感激。