OpenAI发布了一项名为Swarm框架的新AI技术。这是一个开源项目,标志着当前AI领域中又一个里程碑。这一框架为开发者提供了一整套工具,用于创建可以自主合作完成任务和目标的多代理AI系统。
这一发布虽然低调,但它对未来我们与AI的互动方式将产生深远影响。虽然OpenAI明确表示,这只是一个研究和教育实验,但他们在2022年对ChatGPT也是这样说的。
这让我们对未来的ChatGPT有了一个初步的设想,届时你可以向AI提出一个问题,它可以去多个来源进行搜索,并返回一个全面的答案。它还可以代表你在不同网站上执行任务,甚至在现实世界中完成任务。
AI技术的静默革命
目前在AI行业的幕后,正在进行一场静默的革命,许多人在它到来时可能会感到惊讶。我们最近看到了它的初步迹象,但它的全面影响仍在未来。并且,它与大家集中关注的AGI(通用人工智能)不同,它走向的是另一条路。
在AI研发的深处,科学家们正在努力创建合作的AI代理,这些系统将协同工作完成任务,而不是像现在的聊天机器人那样提供即时的答案。那么,为什么这很重要?
理解当前AI的局限性
为了理解这一点,我们需要了解当前AI的局限性。大多数人使用的AI主要依赖于大型语言模型(LLM),这些模型为用户提供通用服务。从文本翻译、报告写作到数学作业帮助,这些模型提供了“万事通,但样样不精”的解决方案,非常适合普通用户的日常需求。
然而,随着技术的发展,专门领域的定制化系统正在兴起。比如,医疗领域的机器人,或用于提供金融建议的工具。这些专用产品通常由大公司内部开发,市场上也逐渐出现一些以订阅服务形式提供的专业AI工具。
一个很好的例子是Lyrebird,该工具专为在医生与病人的会诊中监听(经病人允许)并将其转录为患者的临床记录。这类AI已经显示出强大的实用性。
系统2技术和长时间推理
最新一代的AI,通常被称为“系统2技术”,结合了许多新功能。大家可能已经听说过OpenAI的o1模型,它在提供解决方案之前会花更多时间“思考”问题。推理能力被视为系统2 AI模型的关键特性。开发人员现在将长时间推理视为提高AI输出质量的重要优势,而这与一年前“速度优先”的理念形成了鲜明对比。
Swarm框架的作用
长时间推理和问题解决只是新AI的部分功能。伴随这些新特性,我们即将见证代理性AI的爆发。这些软件代理将能够自主完成任务,实现用户设定的目标,无需提示。如果这听起来像科幻小说,那么你应该知道,这类代理已经在某些任务领域中使用。
一个例子是Factory.ai,它提供的软件工程代理被称为“Droids”,可以自动完成企业应用程序的开发和部署。该公司估计,每位软件工程师每年可节省约18,000美元。这样的工具正成为一种强大的生产力工具。
新的Swarm框架旨在让这类工具的创建和部署更加简单,因此在接下来的两年内,我们可以预期市场上将会涌现出大量的代理解决方案。
最终思考
OpenAI的竞争对手Anthropic的首席执行官Dario Amodei曾描述道,未来的强大AI将进入我们的生活,它拥有虚拟人类的所有“接口”,包括文本、音频、视频、鼠标和键盘控制以及互联网访问。它不仅仅是被动回答问题,而是可以自主执行需要数小时、数天甚至数周的任务。
科学家们正在为我们描绘这样一个未来,虽然我们不知道确切的时间表,但所有迹象表明,这一切可能很快到来。