微软开源Magentic-One:用于解决复杂任务的通才多代理系统

收录于话题

#AI agent

微软开源Magentic-One:用于解决复杂任务的通才多代理系统

微软于11月7日发布 Magentic-One 系统,通过协调多个专用 AI 智能体,高效处理复杂工作流程。

Magentic-One 是一个通才多智能体系统,用于自主完成复杂任务。

主体工作由 Orchestrator 代理协调,该代理负责任务分解和规划、指导其他代理执行子任务、跟踪总体进度以及根据需要采取纠正措施。

其他代理专门具备完成临时、开放式任务所需的不同能力,例如浏览 Web 和与基于 Web 的应用程序交互、处理文件以及编写和执行 Python 代码

Magentic-One 的 Orchestrator 代理会创建计划,将任务委派给其他代理,并跟踪目标的进度,并根据需要动态修改计划。

Magentic-One 的代理架构

Orchestrator 可以将任务分别委派给 FileSurfer 代理来读取和处理文件,将 WebSurfer 代理委派给 WebSurfer 代理来操作 Web 浏览器,或者将任务委派给 Coder 或 Computer Terminal 代理来编写或执行代码。

微软开源Magentic-One:用于解决复杂任务的通才多代理系统

Magentic-One 中的 Orchestrator 代理与四个专用代理进行协调:WebSurfer、FileSurfer、Coder 和 ComputerTerminal。

  • WebSurfer是一个基于LLM的代理,擅长理解和执行与Chromium浏览器相关的命令,并将网页状态变化反馈给Orchestrator,类似于电话技术支持中的操作员。

  • WebSurfer能够执行网页导航、操作和阅读任务,通过直接使用文档Q&A技术,减少了与Orchestrator的通信次数,提高了任务效率。

  • WebSurfer在与网页元素交互时,使用标记集提示和带注释的屏幕截图来确定操作的具体位置,实现了多模式操作。

  • FileSurfer与WebSurfer类似,但它操作的是自定义的文件预览应用程序,支持多种文件类型,并能执行文件导航任务。

  • Coder是一个专注于编写代码和分析信息的LLM代理,能够创建新程序或调试旧程序,并显示控制台输出。

  • ComputerTerminal提供了对控制台shell的访问,允许执行Coder编写的程序和运行shell命令,以扩展编程工具集。

Magentic-One 的多代理工作流程

Magentic-One 具有一个 Orchestrator 代理,该代理实现了两个循环:一个外部循环和一个内部循环。

  • 外部循环(带有实心箭头的较浅背景)管理任务分类账(包含事实、猜测和计划)。

  • 内部循环(带有虚线箭头的深色背景)管理进度分类账(包含当前进度、分配给代理的任务)。

微软开源Magentic-One:用于解决复杂任务的通才多代理系统

在高级别上,工作流包含两个循环,外部循环维护任务分类账,其中包含整体计划,而内部循环维护进度分类账,该分类账指导和评估包含对专用代理的指令的各个步骤。

外循环

外部循环由初始提示或任务触发。作为响应,Orchestrator 会创建任务账本,作为任务持续时间的短期内存。

收到任务后,Orchestrator 会反映请求,并在任务分类账中预先填充重要信息 – 给定或验证的事实、要查找的事实(例如,通过 Web 搜索)、要派生的事实(例如,以编程方式或通过推理)以及有根据的猜测。

内循环。

在内部循环的每次迭代期间,Orchestrator 会回答 5 个问题以创建进度账本:

请求是否完全满足(即任务完成)?报告前一个元素的问题

团队是循环还是重复?报告前一个元素的问题

是否取得了进展?报告前一个元素的问题

接下来应该由哪个座席发言?报告前一个元素的问题

应该向该团队成员提出什么指示或问题?报告前一个元素的问题

在回答这些问题时,Orchestrator 会同时考虑任务分类账(包含事实、猜测和计划)和当前座席对话上下文。

项目官网magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks

GitHub仓库https://github.com/microsoft/autogen/tree/main/python/packages/autogen-magentic-one

技术论文https://www.microsoft.com/en-us/research/publication/magentic-one-a-generalist-multi-agent-system-for-solving-complex-tasks/

知识星球沉淀了很多AI的掘金素材集,欢迎加入!

微软开源Magentic-One:用于解决复杂任务的通才多代理系统

如果觉得不错,欢迎点赞、在看、转发,您的转发和支持是我不懈创作的动力~

如果想第一时间收到推送,可以给我个星标?~

谢谢你挤出时间看我的文章推送,一眼万年,不胜感激。

  文章内容来自于网络,由百合树AI整理,如有侵权,联系删除。如需开始AI写作请返回主页。

上一篇:

下一篇:

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注