智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

收录于话题

#AIGC内容创作

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

?类与机器的互动?式正在发?范式转变。这是由于只有对话功能的 Chatbot,正在进化为“有?、有脑、有眼睛”的?主 Agent。  

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

作为最早探索 Agent 的?模型企业之?,智谱今天带来了多个新进展:  

? AutoGLM 可以?主执?超过 50 步的?步骤操作,也可以跨 app 执?任务  

? AutoGLM开启「全?动」上?新体验,?持等数?个?站的??驾驶  

? 像??样操作计算机的GLM-PC 启动内测,基于视觉多模态模型实现通?Agent的技术探索  

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

在 Agent OpenDay 现场,AutoGLM 给在场数百位嘉宾发送了「?个来? AI 的微信红包」,并且?机远程指挥电脑?动发送?件。  

人在发布会现场,很荣幸成为200位幸运观众之一。

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法
智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

 

?智谱 CEO 张鹏需要做的,只是在现场下达?个简单语?指令。这些原本对于机器???常复杂的操作,今天完全由智谱产品化的 Agent 完成。  

下?的短?介绍了 Agent 操作?机、电脑,以及?机电脑联动的场景。

?起来看看 agent 如何帮助打??度过「光说不?」的?天。 

 

AutoGLM 新升级:挑战更复杂

新升级的 AutoGLM 可以挑战完成复杂任务:  

1. 超?任务:理解超?指令,执?超?任务。例如,在采购?锅?材的例?中,AutoGLM ?主执?了 54步?打断操作。并且,在这种多步、循环任务中,AutoGLM 的速度表现超过??动操作。  

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

2. 跨 app :AutoGLM ?持跨 App 来执?任务。??将习惯于 AI ?动处理,?不是在多个 APP 间来回切换。由于?前 AutoGLM 形态更像是??和应?间的APP执?的调度层,因此跨 App 能?是???常关键的?步。  

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

3. 短?令:AutoGLM 能够?持?任务的?定义短语。今天,你不?再给AutoGLM说:“帮我买?杯瑞幸咖啡,?椰拿铁,五道?店,?杯、热、微糖” 这类超?指令,只需要说“点咖啡”。  

4. 随便模式:我们都会陷?选择恐惧,AutoGLM 今天可以主动帮你做出决策。随便模式下所有步骤都让 AI 决策,带来有抽盲盒式的惊喜。想不想尝尝AI为你点的咖啡?味?  

同时 AutoGLM 启动?规模内测,并将尽快上线成为?向 C 端??的产品。 AutoGLM 同时宣布启动 [10个亿级 APP 免费 Auto 升级」的计划,邀请 App 伙伴联合探索??的 Auto 新场景。  

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

?持核?场景和核?应?的 AutoGLM 标品 API,会在两周内上线到智谱maas开放平台(bigmodel.cn)试?。Web 端开启「全?动」上?新体验:即?起智谱清?插件上线 AutoGLM 功能,?持搜索、微博、知乎、Github 等数?个?站的??驾驶。 


GLM-PC 邀测:?向「??驾驶」电脑的?次技术探索

不只是基于?机和浏览器,今天智谱还带来基于 PC 的?主Agent。GLM-PC 是 GLM 团队?向「??驾 驶」PC的?次技术探索,基于智谱的多模态模型 CogAgent。 

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

?前开放第?阶段的内测场景,包括:  

  1. 会议替?:帮??预定和参与会议,发送会议总结。
  2. ?档处理:?持?档下载、?档发送、理解和总结?档。
  3. ??搜索与总结:在指定平台(如微信公众号、知乎、?红书等)搜索指定关键词,完成阅读、总结。
  4. 远程和定时操作:远程?机发指令,GLM-PC 可以?主完成电脑操作;设定?个未来时间,在开机状态下定时执?任务。
  5. 隐形屏幕:在???作时,GLM-PC 可以在隐形屏幕上?主完成?作,解放屏幕使?权。
智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

??电脑的过程??眼看图形及?字,?脑规划,再??执?单击双击、输?等操作。GLM-PC ?电脑的?式?乎完全和??样。也正因如此,理论上只要是为?类设计的应?,在GLM-PC学习之后它都能够执?。这是?种系统级、跨平台的能?,不依赖于 HTML、API,具备更?的能?上限。  

 

AutoGLM和GLM-PC是智谱AI迈向AI智能操作系统的重要尝试。它们的出现源于智谱在?语?模型、多模  

态模型、逻辑推理和?具使?等??的技术积累。从23年4?的AgentBench开始,到8?的CogAgent  

模型,智谱针对AutoGLM,和GLM-PC的模型CogAgent的研发?作进?了?年半的时间。  

 

与 OpenAI 有所不同,智谱定义了?模型发展的五个阶段:L1 语?能?、L2 逻辑能?(多模态能?)、L3 使??具的能?、 L4 ?我学习能?、 L5 探究科学规律。  

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

发展?今,?模型已经初步具备了?类与现实物理世界互动的部分能?。“Agent 将极?地提升 L3 使??具能?,同时开启对 L4 ?我学习能?的探索。” 张鹏说。张鹏表?,未来 GLM 团队将继续加速 agent 模型产品的研发,期待着?句话操作电脑和?机的范式尽快到来。  


?模型从 Chat ?向 Act

如今,?模型技术正在改变机器和?的互动?式,基于理解需求、规划与决策、执??动和?我反思,Agent 将带来符合直觉的?机交互?从?适应机器,到让机器适应?。  

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

苹果(Apple Intelligence)、Anthropic(Computer Use)、?歌(Jarvis)和 OpenAI (Operator)等企业也已经把 Agent 作为 2025 年的主要关注点。业内普遍认为,2025 年将是 Agent 爆发之年。Gartner 近期将 agentic AI 列为 2025 年??技术趋势之?,并预测 2028 年?少有 15% 的  

?常?作决策将由 agentic AI ?主完成,?这?数字在 2024 年为 0。  

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

与 GenAI 不同,Agent 是?标驱动型的,能够完全执??作流程,适应、学习、迭代、与其他系统和?类协作,并端到端地完成任务。在张鹏看来,Agent 可以看作是?模型通?操作系统 LLM-OS 的雏形。 

“现阶段,AutoGLM 相当于在?与应?之间添加?个执?的调度层,很?程度上改变?机的交互形式。更重要的是,我们看到了 LLM-OS 的可能,基于?模型智能能?(从 L1 到 L4 乃?更?),未来有机会实现原?的?机交互。将?机交互范式带向新的阶段。”  

?模型和 Agent 的发展不仅为??带来了AI时代智能设备的新范式,更意味着?模型技术更?阔的落地空间。从智能设备?向智能?络,在不久的将来,我们将看到AI原?设备的互联互通和?限可能。  

在这个过程中,智谱也将提供?系列的产品和能?,帮助智能设备们拥抱?模型,加速迈向 AI 原?设备新时代。 

【我是谁】

绛烨,enfp/infp,AI科技自媒体博主,公众号“AIGC新知”主理人(目前粉丝量10000+)

主业在一家教育公司做AI产品运营兼agent开发。

【我能提供】

(1)公众号文章合作,可友情or付费or资源置换

(2)社群相关资源

(3)AI头部KOL资源

(4)教育/agent开发等方面讨论交流

【我需要】

(1)AI教育相关认知/资源

(2)AI agent开发定制,课程培训合作等。

(3)商务合作可直接联系,期待多多交流,共同进步

加我探讨交流。

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

知识星球沉淀了很多AI的掘金素材集,欢迎加入!

智谱 Agent OpenDay | Agent 交互新体验:跨 app、跨设备、更多玩法

如果觉得不错,欢迎点赞、在看、转发,您的转发和支持是我不懈创作的动力~

如果想第一时间收到推送,可以给我个星标?~

谢谢你挤出时间看我的文章推送,一眼万年,不胜感激。

  文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。

上一篇:

下一篇:

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注