互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

用户投稿 110 0

精智能体互联网(The Internet of Agents)全面综述

旺精通:细节全解,深度精通

当无数智能体遍布我们的生活,从虚拟助手到实体机器人,它们如何实现高效协作、构建智能世界?智能体互联网(IoA)或许就是解开这个谜题的关键钥匙。它有何独特之处?又将如何重塑我们的未来?一起来探寻其中奥秘。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

我们解读最新技术,文末有相关信息。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

作者:张长旺,图源:旺知识

如今,像聊天机器人、智能车辆等人工智能智能体越来越常见,它们能自己感知、思考和行动。随着智能体数量增多且应用场景变复杂,就需要一个统一的框架让它们能更好地“交流合作”,IoA就为此而生。研究IoA有助于构建更智能、高效的智能体生态系统,推动人工智能在各领域的发展,对未来社会的数字化、智能化转型意义重大。

摘要&解读

随着大型语言模型和视觉语言模型的迅速普及,人工智能智能体已从孤立的、特定任务的系统演变为能够自主感知、推理和行动的交互式实体,无需人类干预。随着这些智能体在虚拟和物理环境中(从虚拟助手到实体机器人)的广泛应用,建立一个统一的、以智能体为中心的基础设施变得至关重要。在本综述中,我们介绍了智能体互联网(IoA)作为一个基础框架,它支持大规模异构智能体之间的无缝互联、动态发现和协作编排。我们首先介绍了通用的IoA架构,强调了其层次结构、与传统互联网的区别特征以及新兴应用。接下来,我们分析了IoA的关键运行支撑技术,包括能力通知与发现、自适应通信协议、动态任务匹配、共识与冲突解决机制以及激励模型。最后,我们指出了构建弹性和可信IoA生态系统的开放性研究方向。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述 研究背景 :大型语言模型和视觉语言模型的快速发展,促使人工智能智能体从孤立、特定任务系统转变为自主交互式实体,广泛应用于虚拟和物理环境。随着智能体数量增多和应用场景复杂化,传统互联网和物联网架构无法满足智能体间高效通信、协作与协调需求,亟需建立统一的以智能体为中心的基础设施,智能体互联网(IoA)应运而生。研究贡献提出通用架构 :给出全面的IoA架构,涵盖智能体类型、功能模块、互联子IoA及分层架构设计,明确其层次结构与功能划分。分析关键特征与区别 :深入剖析IoA自主智能、高动态性等关键特征,对比其与传统互联网、物联网的差异,凸显IoA独特性。探讨工作范式 :详细研究IoA工作范式,包括能力通知与发现、任务编排、通信协议等关键技术,为IoA运行提供技术支撑。指出研究方向 :识别IoA在安全自适应通信、去中心化生态等方面的开放性挑战,指明未来研究方向,推动IoA发展。实现设计架构设计 :构建分层IoA架构,基础设施层整合AI资源;智能体管理层负责智能体身份与能力管理;智能体协调层处理任务执行与协作;智能体应用层提供标准化接口支持特定领域应用。关键技术设计 :能力通知与发现通过自我报告、系统验证等评估智能体能力,采用多种方式实现能力通知与检索;交互结构与任务编排设计多种交互模式和通信拓扑并进行优化,通过基于规则或学习的方法分解任务,基于路由或自组织策略分配任务;通信协议制定MCP、A2A等协议实现智能体间互操作;共识与冲突解决采用发言顺序规范、推理对齐等方法确保智能体一致行动;经济模型通过定价和激励惩罚机制促进智能体协作;可信监管利用DID、区块链等技术保障IoA可信运行。

一、引言

大型模型的快速发展,包括大型语言模型(LLM)和视觉语言模型(VLM),开创了人工智能智能体(或智能体人工智能)的新时代[1],[2],将它们从孤立的、特定任务的模型转变为自主的、交互式实体。这些智能体可以独立感知、推理和行动,能够在复杂环境中与人类和其他智能体无缝协作,这标志着向通用人工智能(AGI)迈出了关键一步[3],[4]。从虚拟助手到类人机器人、自主无人机(UAV)和智能车辆等实体系统,人工智能智能体正迅速融入日常生活[5]。科技巨头已宣布开发下一代人工智能智能体,如OpenAI的Operator和字节跳动的豆包智能体。例如,Hugging Face平台托管了超过100万个开源模型,而腾讯元宝支持超过10万个专业智能体。根据Gartner[6]的数据,到2028年,至少15%的日常任务将由人工智能智能体自主完成,33%的企业应用将融入智能体驱动的智能。随着人工智能智能体的普及,它们有望成为数字和物理空间中的“新公民”,重塑经济结构和人类社会互动。

智能体的广泛应用催生了对实时跨域智能体通信和协调的需求,尤其是在包含数百万异构智能体的智慧城市等场景中。智能体互联网(IoA)[7],[8],也称为智能体网络,作为下一代智能系统的基础架构应运而生,它支持大规模虚拟/实体智能体之间的无缝互联、智能体自主发现、动态任务编排和协作推理。与以人为中心的互联网不同,IoA以智能体为中心,优先考虑智能体间的交互[9],其中交换的信息从面向人类的数据(如文本、图像和音频)转变为面向机器的数据对象(如模型参数、加密令牌和潜在表示)。此外,交互方式正从图形用户界面(GUI)演变为通过自动协商[11]进行的语义感知和目标驱动的通信[10]。此外,通过提供可扩展的网络AI推理和共享感知能力,IoA使资源受限的智能体(如移动设备和无人机)能够访问高级AI能力[12]和超视距(BLOS)感知。通过促进不同实体的虚拟和实体智能体之间的无缝互操作性,IoA引入了超越当前互联网和移动互联网的新连接范式和流量模式。随着这个生态系统的不断发展,IoA有望成为人类与AI共生新时代的支柱,重塑全球连接并推动智能系统的前沿。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

尽管前景广阔,但大规模IoA的实际部署面临若干关键挑战。

互联性 :现有的多智能体系统(MAS)主要在单个设备上进行模拟,而现实世界的IoA部署涵盖数十亿地理分布的智能体,每个智能体都有独特的计算、网络、传感和能源配置[7]。这种转变需要新的智能体网络架构,支持异构智能体之间的无缝互操作性,打破数据孤岛。此外,IoA应为大型模型提供完整的上下文感知和对所有基于互联网的工具的访问[13]。智能体原生接口 :当前的计算机使用智能体(如OpenAI的Operator)依赖模仿人类GUI操作(如点击和击键)来控制浏览器和应用程序[14],这会导致较高的屏幕抓取开销。IoA应使智能体能够通过原生方式(如API或语义通信协议)与其他智能体和互联网资源交互[9],[13],而不是模仿人类行为。自主协作 :IoA包括在高度动态环境中运行的物理和虚拟智能体。实体智能体(如自主机器人和无人机)具有空间移动性,而软件智能体可以根据需要实例化、迁移或终止。通过利用大型模型的力量,IoA应使智能体能够自组织、自动协商并形成低成本、高效率的协作网络,用于智能体自主发现、能力共享、任务编排和负载平衡[7]。

随着IoA的不断发展,应对这些挑战对于实现大规模IoA部署和释放下一代自主人工智能系统的全部潜力至关重要。

A. 与现有综述的比较及我们工作的贡献

基于大型模型的智能体和多智能体系统的最新研究已引起学术界和工业界的广泛关注。Jin等人[15]回顾了多智能体系统中的智能决策方法、算法和模型,并将其分为基于规则、博弈论、进化算法、多智能体强化学习(MARL)和基于LLM的方法。Guo等人[16]通过探讨智能体-环境接口、LLM智能体特征、智能体间通信策略和能力获取范式,系统地研究了基于LLM的多智能体系统的发展,同时强调了其在问题解决和世界模拟中的应用。Tran等人[17]根据类型、策略、结构和协调等关键特征对基于LLM的多智能体协作系统进行了分类。Li等人[18]对基于LLM的多智能体系统的构建进行了全面综述,重点关注问题解决和世界模拟。Wang等人[2]回顾了LLM智能体的整体框架,包括使能技术、核心特征、协作范式及其相关的安全和隐私挑战,以及未来人工智能智能体系统的潜在防御策略。Wu等人[19]对基于LLM的多智能体自动驾驶系统进行了综述,探讨了多车辆交互、车联网通信和人机共驾。He等人[20]系统地评估了基于LLM的多智能体系统在软件工程中的能力和局限性。Amirkhani等人[21]通过回顾分类法、动态模型、协议、控制机制和应用,概述了多智能体系统中的共识问题。

现有综述主要关注多智能体系统(MAS),存在三个挑战。1)生态系统隔离:现有框架将智能体限制在各自的环境中,限制了第三方智能体的集成,降低了能力的多样性。2)单设备模拟:大多数MAS仅限于单设备模拟,这与智能体在多个设备和不同地理位置运行的现实场景形成鲜明对比。3)僵化的通信和协调:大多数现有智能体协议和状态转换是硬编码的,无法捕捉实际协作的动态、任务特定性质。相比之下,本综述侧重于基于大型模型的智能体的网络方面,探讨了智能体互联网(IoA)的架构和开放性挑战。表II将我们的综述与IoA领域的相关综述的贡献进行了比较。我们对IoA的基础、新兴应用和开放性挑战进行了全面综述,为其进一步发展和实际部署铺平了道路。我们的综述旨在:1)全面理解IoA架构及其促进多样化、分布式智能体集成的网络机制;2)批判性地审视IoA的运行范式,包括智能体动态发现、任务编排、通信协议和共识机制。主要贡献包括:

通用IoA架构 :我们全面概述了IoA架构,讨论了其层次框架、与传统互联网的区别特征、关键特征和新兴应用。IoA的关键使能技术 :我们分析了支撑IoA的构建模块和使能技术,包括能力通知与发现、动态任务编排与匹配、自适应通信协议、共识与冲突解决机制以及经济模型。IoA的开放性挑战 :我们识别了IoA领域的几个未解决问题,并指出了促进其广泛采用和稳健发展的未来研究方向。

B. 论文结构

本文的其余部分组织如下。在第二节中,我们详细探讨了IoA架构。第三节探讨了IoA的构建模块和使能技术。最后,第四节概述了推进IoA的未来研究方向。本综述的组织结构如图1所示,关键缩写词汇总在表I中。

二、智能体互联网概述

在本节中,我们首先介绍IoA的架构。然后探讨IoA范式的核心特征,接着考察IoA、传统互联网和物联网(IoT)之间的关键区别。最后,我们重点介绍IoA在各个领域的新兴应用。

A. IoA架构

IoA是一种新兴的以智能体为中心的基础设施,连接跨多个领域的数十亿自主智能体(虚拟和实体)。它支持异构智能体之间的实时通信、发现和协调,支持动态环境(如智慧城市)中的复杂任务编排。IoA或智能体网络的出现,代表了用户和服务与数字领域互动方式的根本性转变。

智能体类型 :在IoA中,智能体可大致分为两种主要类型:虚拟智能体和实体智能体。虚拟智能体 :完全在数字环境中运行,包括聊天机器人、虚拟助手、客户服务智能体和其他基于软件的自主系统[22]。它们利用高带宽的有线或持久网络连接来处理大规模语言模型,访问远程知识库,并通过图形、语音或可穿戴界面与用户交互。实体智能体 :如家庭机器人、无人机和自动驾驶车辆,存在于物理世界中,依赖车载传感器(如摄像头、激光雷达、惯性测量单元)和执行器来感知和操纵环境[4]。它们通常在可变的无线条件下进行远程协调。互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述 智能体的功能模块 :无论形式如何,如图2所示,每个IoA智能体通常包含四个核心功能模块[1],[2]:规划、记忆、交互和行动,这些模块共同使智能体能够在复杂环境中运行、学习和适应。规划 :在大型模型的支持下,规划模块是智能体的大脑,实现高级推理、任务分解和决策。它不断参考记忆模块,融入过去的经验和外部知识,生成上下文感知的行动计划。典型的LLM驱动规划技术包括两种模式。(i) 无反馈规划:将复杂任务分解为子目标的顺序和结构化推理方法,如思维链(CoT)[23]、思维树(ToT)[24]、思维图(GoT)[25]。(ii) 反馈增强规划:将计划生成与任务反馈(如实时执行和自我反思)相结合的集成推理-行动框架,以迭代纠正错误和优化策略,如ReAct[26]、Reflexion[27]和VOYAGER[28]。记忆 :记忆模块通过维护短期上下文(如正在进行的对话和最近的任务结果)和长期知识(如积累的领域事实和过去的交互记录),支持智能体的学习、适应和个性化行为[3]。通过将实时更新与历史数据相结合,它实现了持续学习、个性化和明智决策。记忆可以分为三种类型。(i) 短期记忆[29]是用于最近观察和对话轮次的有限上下文缓冲区,确保连贯、最新的推理。(ii) 长期记忆[30]是外部向量存储或知识库,存档历史经验、领域事实和策略,通过检索增强生成(RAG)[31]访问,用于明智规划。(iii) 混合记忆[32]是一种动态缓存,将关键的短期片段提升为长期存储,并将相关的长期条目检索回工作缓冲区。交互 :交互模块使IoA智能体能够通过融合多模态输入(从自然语言和情感提示到激光雷达和摄像头等传感器流)为统一的语义表示,在人类、智能体和环境接口之间进行通信和协作。它提取意图和情境上下文,使智能体能够保持对其物理环境和数字环境的感知。(i) 智能体-智能体交互:智能体通过语义协议交换结构化知识、协商角色、分配团队工作和协调共享任务。(ii) 智能体-人类交互:通过解析自然语言、情感信号和对话历史,智能体保持一致的人物形象和情感融洽。树状人物模型[33]有助于在长时间的对话交流中管理角色连续性和角色分配。(iii) 智能体-环境交互:智能体通过闭环反馈与物理和虚拟环境互动。自采样强化学习(RL)和课程微调[34]等技术使智能体在网络导航、混合现实任务和现实世界机器人应用中表现出色。行动 :行动模块通过与物理执行器和软件工具接口,将智能体的计划变为现实。它还通过感知模块监控执行结果,调整行为以处理意外障碍或变化的目标。它包括两个主要能力:(i) 实体操作:将高级计划转化为现实世界的行为,如机器人抓取、导航或操纵。例如,在SayCan[35]中,仓库机器人可以使用LLM建议拾取姿势(“Say”),并使用学习的可供性模型验证可行性(“Can”),确保在变化的条件下可靠执行。(ii) 工具调用与创建:使智能体能够调用外部服务,如搜索引擎、API或数据库,以收集信息或执行子任务。智能体还可以合成新工具(如自定义数据处理脚本),扩展其行动 repertoire,提高效率。

这些模块共同使智能体能够在复杂、动态的环境中自主和协作地运行。通常,每个智能体有两个部分[2]:一个由大型模型驱动的大脑和一个物理或数字身体(如无人机、机器狗和数字人)。具体而言,根据通用性,大型模型分为两个主要类别:(i) 基础模型(如DeepSeek-R1和GPT-4o),提供通用认知能力;(ii) 特定任务大型模型,针对特定领域的下游任务进行微调。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述 互联的子IoA :如图3所示,IoA架构由多个互联的、特定领域的智能体网络组成,称为子IoA。每个子IoA半自主运行,由指定的网关节点支持,该网关节点托管一个网关代理智能体[8],负责协调资源、智能体注册与发现、域内智能体能力通知,以及跨域中继和状态同步。这种层次结构支持在不同环境中进行可扩展的模块化部署。

为了支持大规模分布式和高效的IoA管理,网关代理智能体[8]充当域级任务请求和全局分布式资源(如工具、智能体和智能体应用程序)之间的智能中介。它提供两项主要服务:(i) 用于注册和发现的资源注册表;(ii) 智能匹配和检索机制,语义解释任务查询并相应识别相关资源收到任务请求后,代理智能体搜索其本地注册表、特定领域过滤器和基于策略的防护措施,对候选智能体进行排名,并返回最合适的匹配项。访问控制策略和自动资源验证等安全措施进一步保障了系统的可靠性和可信度。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述 通用IoA架构 :如图4所示,分层的IoA架构包括以下四层,实现可扩展、安全和互操作的智能体协作。基础设施层 :作为IoA的基础,集成了AI模型、数据、知识、计算和通信等关键资源[7]。DeepSeek-R1、GPT-4o和LLaMA 4等基础模型作为运行在异构平台(包括基于云的GPU/TPU集群、边缘节点和无人机、机器人等终端设备)上的智能体的认知核心。数据基础设施支持广泛的多模态输入,包括文本、传感器流、3D点云和实时流,这些输入被结构化为公共或私有资产,并通过提示存储库以及特定领域和专有知识库进行丰富。可靠的低延迟连接由各种通信技术实现,包括5G URLLC、用于自主智能体的网状网络和基于卫星的备份链路。智能体管理层 :管理IoA内智能体的身份、能力、发现和生命周期。身份机制应支持自主识别和安全跨域认证,如去中心化标识符(DIDs)[36]。智能体能力是多维的(包括功能、上下文和特定领域属性),可以使用支持动态更新和机器可读发现的语义模型进行描述。此外,灵活的通信框架,如发布-订阅(pub/sub)机制[37],促进能力公告,而分布式注册表和上下文感知发现机制[38],[39](如意向匹配)实现智能体注册和面向任务的智能体匹配。智能体协调层 :管理分布式任务执行和智能体协作。它支持任务分解[23]-[25]、流程编排[40]、自适应通信协议[11]和动态智能体-任务匹配[41]。此外,冲突解决和共识机制[21],如拜占庭容错和仲裁,确保在对抗环境中的鲁棒性。其他功能包括信任管理、计费、安全保障和隐私保护机制,共同为大规模多智能体协调提供安全、可靠和可问责的基础。智能体应用层 :提供标准化接口和语义对齐,支持互操作的特定领域智能体生态系统[8]。它促进跨模态、语义和知识级集成,使智能体能够在不同的异构环境中无缝运行。代表性的IoA应用包括智慧城市中的交通优化和应急响应[19]、智能工厂中的预测性维护和供应链管理[42],以及医疗保健中的协作手术机器人和诊断[43]。

B. IoA的关键特征

通常,IoA具有以下独特特征。

自主智能 :在IoA范式中,智能体具有高度的自主性,能够主动宣传自己的能力并独立发起协作[7],[9]。它们可以动态编排任务流、协商交互协议、解决冲突并达成共识,无需人工干预。相比之下,传统互联网系统依赖针对特定应用的僵化预定义协议和API,而物联网设备仅提供有限的自动化和智能。由大型模型驱动的IoA智能体超越了这些限制,实现了自主能力发现、自适应推理和实时任务编排。关键机制包括:主动能力发现 :智能体通过在网关注册时宣传自身能力[8],并根据需求定位互补的协作伙伴,实现自主发现。自主工作流编排与交互拓扑优化 :通过持续协商和重新规划,智能体自主分解任务[23]、分配子任务[41]并调整执行流程[40]。此外,它们自主优化交互拓扑[44],例如在协商中决定智能体的发言顺序,以提高动态环境中的效率。自适应冲突解决与共识 :通过上下文协商,智能体可以自主检测和解决冲突,调和竞争目标,并就共识策略达成一致[7],[45]。高动态性 :IoA网络本质上是动态的,其特点是虚拟智能体的按需创建、迁移和终止,以及无人机和机器人等实体智能体的物理移动性。这种敏捷性使智能体团队能够实时重新配置,以适应不同的任务需求、环境条件或资源限制。此外,智能体的能力以及任务编排和交互协议也在不断调整。按需智能体生命周期 :智能体根据任务负载或资源可用性动态启动或退役。例如,客户服务智能体集群在销售高峰期间扩展,需求消退后收缩。智能体能力演进 :智能体能力也依赖于上下文,根据当前任务目标、工具可用性及其功能配置文件(如传感器套件和推理引擎)进行调整。例如,地面机器人可能部署其摄像头和激光雷达融合管道来导航复杂地形,但在解释语音命令时切换到自然语言处理(NLP)模块,表现出差异化的能力。实时工作流重新配置 :智能体之间的任务工作流编排和交互策略具有高度动态性,要求智能体实时持续调整其角色、行为和通信模式,以维持有效的协作[17]。例如,遇到交通拥堵的自主配送车队可以即时重新协商路线、重新分配配送任务并更新消息传递模式。高异构性 :IoA涵盖了广泛的虚拟和实体智能体,从微控制器节点和自主无人机到GPU集群驱动的智能体和家庭机器人,每个智能体都有不同的模型架构和独特的计算、能源、传感和通信能力。这些智能体在异构网络(如蜂窝网络、卫星网络和网状Wi-Fi)上运行,具有不同的访问模式和链路类型[2],形成了一个挑战无缝互操作性的异构生态系统。能力差异 :智能体从电池受限的终端设备到具有丰富GPU和内存的大型模型智能体不等。任务分配和工作负载卸载应动态适应智能体的资源限制。感知模态多样性 :数据格式涵盖激光雷达点云、高光谱图像、生物传感器流和语言嵌入。无缝协作需要即时模态转换和对齐,例如将点云扫描转换为语义图以进行规划智能体。通信异构性 :智能体通过多个通信链路进行通信。互操作性需要多层协议栈和运行时适配器,以协商不同通信类型之间的带宽、延迟和安全权衡。大规模可扩展性 :IoA应从小型临时智能体团队扩展到跨分布式域的数十亿智能体。这需要弹性的IoA架构,支持在动态工作负载下对大量智能体进行实时发现、分组和重新配置。分层分片 :智能体根据地理位置、功能或任务关联性自组织成分层集群或“分片”[18]。例如,域网关托管代理智能体,这些代理智能体注册本地智能体,广播其能力,并通过中继网关协调跨域协作和状态同步,如图3所示。弹性资源编排 :多层编排层在云、边缘和设备节点之间动态分配计算、存储和通信资源。需求突发的智能体可以无缝地将工作负载迁移到未充分利用的对等体或云/边缘智能体,而不会中断服务。自适应覆盖网络 :IoA动态构建面向任务的覆盖网络[44],如用于灾难映射的临时微群或智能工厂中的专业维护团队,这些网络在任务开始时自组装,任务结束后解散。通过根据特定任务定制对等(P2P)连接,这些覆盖网络优化了路由效率,减少了不必要的流量,并限制了全局网络 churn[46]。分布式容错与自修复 :在大规模环境中,智能体故障不可避免。IoA集成了轻量级协议来持续监控对等体的健康状况。检测到中断时,智能体自动绕过离线节点重新路由任务并重新分配工作负载,确保系统实时适应并维持整体运行完整性。语义感知通信 :在大型模型的支持下,IoA中的智能体具有高级的上下文感知语义理解和推理能力,使其能够解释意图、调整通信策略并实时对齐含义。与传统互联网或物联网系统(优先考虑可靠数据传输)不同,基于智能体的通信本质上是任务驱动和语义丰富的,具有三个鲜明特征[10]:面向计算的通信 :智能体优先交换上下文感知和任务相关的信息,以支持智能协调,而不是传输原始数据。智能体通信通过在通信前通过网络同步知识库来实现这一点。例如,智能体可能与共享知识库对齐以解释传感器输入,并仅传输必要的推理,从而减少通信开销。持久通信 :智能体协作通常持续较长时间,需要根据不断变化的任务状态进行持续调整。智能体通信利用持久内存来维护共享上下文(如增量知识更新),使智能体能够高效地参考先前的交互。基于记忆的通信 :智能体任务通常表现出顺序推理或迭代优化[26],[27]。智能体利用记忆来压缩消息并为其提供上下文,例如仅传输相对于先前共享知识的更新。

这种从以数据为中心到以意义为中心的通信转变,是构建面向目标、自适应和可扩展的多智能体系统的基础。

任务驱动协作 :IoA优先考虑面向任务的网络,智能体根据任务需求动态调整其能力,并形成临时团队以进行自主跨域操作。智能体-任务匹配 :任务通过语义元数据[8]发布到去中心化注册表。智能体自主宣布其能力,并根据当前工作负载、地理位置、可靠性和服务质量(QoS)指标等标准进行实时匹配。面向任务的团队形成 :匹配后,智能体协商角色、优先级和执行流程,以组建最佳团队[47]。然后,团队实例化临时覆盖网络,如微群,通过自主协商协调子任务。

总结:IoA中智能体的自主智能使其能够动态组建团队,类似于人类团队的按需组建。智能体可以自主协商通信协议、利用各种工具促进交互,并在无需人工干预的情况下解决冲突。然而,这种自主性,加上IoA生态系统固有的异构性和高动态性,在智能体发现、能力公告、互操作性和有效经济激励机制设计方面带来了重大挑战。此外,智能体的任务驱动性质及其对语义通信的依赖需要上下文感知协调和意图的智能解释,进一步复杂化了系统设计。这种从基于规则的自动化和以数据为中心的通信向大型模型驱动的智能和以意义为中心的通信的转变,是实现自组织和面向目标的IoA生态系统的基础。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

D. 新兴IoA应用场景

典型多智能体框架 :LLM的最新进展推动了各种智能体框架的发展,这些框架能够通过高级推理、规划和工具集成实现自主或半自主任务执行。AutoGPT[52]通过递归自提示迭代优化动作,实现自主目标驱动的智能体。AutoGen[41]引入了对话式智能体网络,其中多个LLM驱动的智能体(如助手和用户代理)动态交互,支持人机协作和完全自动化的工作流。LangChain[53]提供了一个模块化框架,用于将LLM调用与外部工具(如API和数据库)和记忆系统链接,为可定制的智能体管道提供灵活性。MetaGPT[37]模拟具有角色的智能体(如产品经理和工程师)的软件开发团队,遵循结构化工作流,增强多智能体协作。其他值得注意的框架包括BabyAGI[54],其专注于任务驱动的自主迭代,以及CAMEL[47],其探索具有通信智能体的角色扮演智能体社会。表IV显示了主流开源多智能体框架的比较。

表III 传统互联网、物联网和IoA的关键比较

维度

传统互联网

物联网(IoT)

智能体互联网(IoA)

核心目标

主机与信息连接

设备与信息连接

智能体与知识连接

服务对象

人类

智能设备(传感器/执行器)

自主智能体(虚拟/实体)

架构

集中式(客户端-服务器)

去中心化(端-边-云)

混合式(P2P+代理)

寻址机制

IP

IP、静态设备标识

IP、动态语义标识

交互模式

被动(请求-响应)

事件驱动(触发式)

主动(目标/任务导向)

通信层级

比特级传输

比特级+轻量级协议

语义级交换

自主性来源

人类控制

基于规则的设备逻辑

大型模型驱动的智能体智能

网络动态性

低(静态拓扑)

中(动态拓扑)

高(演进式交互与移动性)

标准化成熟度

成熟

稳定演进中

新兴演进中

技术路线图 :现有的代表性工业实践包括计算机使用、AI智能手机、Anthropic的模型上下文协议(MCP)[13]和谷歌的智能体到智能体(A2A)协议[9]。(i) 计算机使用智能体(CUAs) :由于现有互联网服务最初是为人类构建的,CUAs[14](如OpenAI的Operator)模仿人类GUI交互(如鼠标点击和击键)来驱动浏览器和移动界面,但会产生显著的屏幕抓取开销,降低智能体效率。(ii) AI智能手机 :AI智能手机(如Apple Intelligence)通过向智能体开放应用程序API,实现跨应用数据访问和功能调用,比GUI模拟更符合智能体处理原始数据的优势。(iii) MCP :将大型模型置于生态系统的核心,将整个互联网视为其上下文知识库和工具包。标准化API、动态插件支持和持久上下文管理使单个模型能够跨各种服务进行编排。(iv) A2A协议 :旨在形成一个去中心化智能体网络,智能体在其中自主发现、协商和协作。最终,IoA应提供(1)无缝互操作性以消除数据孤岛,(2)智能体原生接口以实现直接高效的智能体间交互,以及(3)协议驱动的智能体自组织协作。应用场景 :IoA范式在各个领域具有变革潜力。如图5所示,我们展示了其在三个代表性场景中的应用:智能家居、智能工厂和智慧城市。场景1:智能家居中IoA子网内的智能体通信 :在智能家居环境中,专用的IoA子网使各种家用智能体(如家务机器人、数字生活助手、机器宠物和智能家电)能够自动发现彼此并建立面向任务的P2P覆盖网络。新激活的家务机器人加入家庭网络后,获得唯一的数字身份,识别共处一地的智能体,并动态形成任务组以协调环境监测、 meal preparation和能源管理等功能。智能体在Wi-Fi和蜂窝网络之间动态切换,同时利用IoA子网服务进行多模态数据转发和域内资源共享,从而提供高度自适应、自编排的生活环境。

表IV 主流智能体框架比较

框架

核心特点

优势

局限性

AutoGPT

递归自提示、目标驱动自主

高度自主的任务执行

易陷入循环、计算成本高

AutoGen

对话式多智能体网络、支持人机协作

动态交互、灵活的工作流

复杂场景需手动调优

LangChain

模块化LLM链、记忆与工具集成

可定制性强、支持多种工具

学习曲线较陡

MetaGPT

角色扮演智能体、模拟软件开发团队

结构化协作、降低开发成本

主要适用于软件工程领域

BabyAGI

任务驱动自主迭代

轻量级、易于部署

推理深度有限、适合小规模任务

CAMEL

角色扮演智能体社会、通信智能体

模拟人类社交行为、适用于研究

工具使用优化不足、场景受限

场景2:智能工厂中IoA子网与外部智能体的协调 :在智能工厂内,IoA子网将现场制造智能体(如机械臂、自主导引车和数字孪生控制器)与外部生态系统参与者(如零部件供应商、物流无人机和云分析智能体)连接。例如,在线生产监督智能体可通过供应商的数字助理请求备件,指派自主叉车与配送无人机协商取货时间,并通过二维码或设备到设备(D2D)通信验证身份。在此过程中,网络提供数字身份验证和基于传感的路径规划服务,确保物料准时到达,生产工作流响应供应链动态进行调整。场景3:智慧城市中的跨域智能体网络 :在城市规模上,IoA促进不同利益相关者的异构智能体(如市政交通控制器、公共安全无人机、自动驾驶车辆和应急响应机器人)之间的动态跨域协作。通过基于互信身份认证形成按需任务特定团队,不同实体的智能体可快速集结,进行实时监控、检测异常(如火灾或交通事件)并协调多模态响应。任务完成后,资源自动释放,优化网络负载,确保城市级服务的可扩展和弹性编排。

总结与经验教训:本小节首先综述了现有关键多智能体框架,从目标驱动系统(如AutoGPT和BabyAGI)到模块化管道(如LangChain)和角色扮演模拟(如MetaGPT),突出了智能体间推理、规划和工具集成的进展。然后勾勒了技术路线图,从GUI驱动的CUA和AI智能手机到MCP和A2A协议,再到未来的IoA协议。最后展示了三个代表性IoA应用场景:智能家居中的P2P智能体通信、智能工厂中的现场与外部智能体协调,以及智慧城市中的跨域网络。这些发展共同强调,无缝互操作性、智能体原生接口和协议驱动的自组织是未来IoA的基础。

三、智能体互联网的工作范式

本节基于分层的IoA架构,探讨IoA的使能机制,包括能力通知与发现(第三节A)、任务编排与分配(第三节B)、智能体通信协议(第三节C)、共识与冲突解决(第三节D)、经济模型(第三节E)和可信监管(第三节F)。图6展示了IoA中跨域智能体交互的详细工作流程。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

A. IoA中的能力通知与发现

智能体能力评估 :在IoA中,准确评估智能体的能力是有效任务分配和动态协作的首要任务。与传统多智能体系统不同,基于大型模型的智能体具有高度动态和演进的能力,如多样化的推理范式和自适应工具利用。自我报告的能力声明 :在IoA中,每个新加入的智能体在注册时提供自我报告的能力概况,详细说明其基础模型特征、可用工具和功能专长[7],[9]。例如,一个智能体可能将其概况声明为“{model: “GPT-4o”, tools: [“Web Browser”, “Code Executor”], description: “专业于问答任务”}”。尽管自我报告便于快速加入,但本质上容易出现不准确或夸大的情况。系统能力验证 :为了提高可靠性,网关智能体可以使用标准化评估套件进行能力验证,以客观评估关键能力。例如,推理能力可以使用GAIA[55]评估,而协作和通信技能可以使用RoCoBench[56](尤其针对实体智能体)评估。

然而,发布详细的智能体概况可能会无意中暴露内部模型、工具或策略的敏感信息。因此,开发保护隐私的能力注册框架对于平衡透明度和机密性至关重要。

智能体能力通知 :除了静态评估外,保持智能体能力的最新信息对于IoA系统中的实时能力发现和有效任务编排至关重要。鉴于基于大型模型的智能体的动态演进,IoA应采用能力通知策略,确保智能体之间的持续同步。主动通知 :该策略涉及智能体自主向其网关智能体通知其能力的任何变化[7],如获取新工具、技能或模型升级。事件触发通知 :在这种模式下,智能体概况在重大事件(如成功完成高优先级或复杂任务)发生时更新[57]。通过仅在必要时触发更新,与持续同步相比,该机制有助于减少不必要的通信开销。定期同步 :作为主动和事件触发策略的补充,可以采用固定间隔的定期一致性检查,以维护系统中智能体能力的可靠全局视图。

然而,智能体能力的快速演进会产生大量通信开销,对平衡新鲜度、可扩展性和效率的实时同步机制设计提出了重大挑战。

智能体能力检索 :高效的能力检索对于识别和选择能力与特定任务需求匹配的合适智能体至关重要,尤其是在大规模动态IoA中。为了适应不同的任务复杂度和智能体异构性,已开发了几种检索策略,包括传统搜索[58]、语义检索[38]、基于知识的检索[59]和智能体增强检索[60]。传统搜索 :这些方法通常依赖智能体概况(如技能标签、工具集和领域专长)的精确或模糊匹配[58]。尽管在具有明确标记能力的结构化场景中有效,但它们难以捕捉更深层次的语义关系,限制了其在复杂或模糊查询中的性能。语义检索 :为了捕捉更丰富的语义,语义检索方案利用深度神经网络(DNN),尤其是基于Transformer的模型(如BERT),将智能体概况和查询编码到共享嵌入空间[38],[39]。这种共享空间捕捉术语之间的潜在语义关系,使检索系统能够理解查询背后的意图。基于知识的检索 :该范式通过将特定领域的知识整合到检索过程中,进一步提高了检索的准确性和可解释性[39],[59]。例如,Heuillet等人[59]通过在RAG框架内将结构化知识图与密集向量检索融合,提高了检索精度和推理鲁棒性。然而,传统的RAG系统受限于静态工作流,缺乏多步推理和复杂任务管理的适应性。智能体增强检索 :为了克服静态RAG管道的局限性,最近的方法将自主智能体嵌入检索过程[60]。这些RAG智能体(或称为智能体RAG)融入了反思、规划和工具使用等核心能力,使其能够迭代优化查询、动态选择检索策略,并根据需要与外部工具或API交互。这种反馈驱动的自适应检索过程使系统能够更好地适应实时任务需求,支持上下文感知推理。因此,智能体RAG框架为大型异构智能体池中的能力发现提供了显著改进的灵活性、可扩展性和响应性。

总结与经验教训:智能体之间的能力发现是IoA中有效任务分配和协作编排的前提,包括三个关键组件:能力评估、能力通知和能力检索。①能力评估包括自我报告声明和系统级验证,以构建智能体能力概况。尽管自我报告便于快速注册,但可能导致不准确或夸大;系统验证提高了可靠性,但引入了可扩展性瓶颈和潜在的隐私风险。②能力通知通过主动更新、事件触发机制和定期同步维持实时系统感知。然而,大规模IoA生态系统中的频繁更新会导致通信开销和一致性问题,对效率和可扩展性构成挑战。③通过传统匹配、语义检索、知识增强方法和智能体增强策略进行能力检索,可以提高智能体选择的准确性和灵活性。表V提供了代表性技术及其关键特征的比较总结。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

B. 交互结构与任务编排

为了在IoA中实现最佳性能,核心挑战之一在于编排智能体以确保高效协作,这主要涉及两个基本部分:交互结构设计和任务编排。

交互结构设计 :交互结构设计侧重于确定智能体执行协作任务的最佳交互结构,包括两个关键要素:交互模式和通信拓扑。交互模式定义了智能体如何相互传输、共享和更新信息,包括聚合、反思、辩论和工具使用等模式。同时,通信拓扑指定了智能体在网络中的物理或逻辑连接方式,常见结构包括链式、星形、树形和基于图的配置。

a) 交互结构选择 :图8展示了IoA中常用的交互模式和相应的通信拓扑。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述 交互模式 :典型的智能体间交互模式包括聚合、反思、辩论和工具使用,如图8上部所示。聚合 :在这种模式下,智能体独立生成多样化的预测,随后通过聚合机制统一以产生共识输出。多数投票[61]和自一致性分析[62]等技术被广泛用于增强这种协作模式的鲁棒性和可靠性。反思 :智能体作为评审者,基于先前的输出提供反馈或建议。这种批判性评估被迭代纳入原始生成器或反馈循环本身,导致逐步优化。值得注意的实现包括Self-Refine[63]和Reflexion[27],它们体现了这种反思模式以提升智能体性能。辩论 :这种模式促进辩论式协作,智能体通过结构化对话挑战、证明和改进彼此的预测。每个参与者通过考虑同行的观点和反驳来更新其响应。实证研究表明,这种多智能体辩论通常比单智能体推理产生更真实和准确的结论[40],[64]。工具使用 :工具增强的智能体可以访问外部资源以提高任务性能。这种模式允许智能体调用外部功能,如RAG[31],[65]或通过测试用例进行代码验证的执行器[66],[67],从而生成更明智和可操作的响应。智能体网络拓扑结构 :除了交互模式,通信拓扑在塑造IoA中多智能体系统的协作效率和可扩展性方面起着关键作用。如图8下部所示,典型的拓扑结构包括链式、星形、树形和图结构,总结如下:链式 :智能体按线性顺序组织,每个智能体处理来自直接前驱的输入,并将结果转发给下一个智能体。这种拓扑支持流水线协作,已在ChatDev[68]、MetaGPT[37]和L2MAC[45]等框架中应用。星形 :一个中心智能体(通常作为指挥官、协调员或教师)监督和指导一组智能体。这种拓扑实现集中控制,常见于AutoGen[41]、SecurityBot[69]和MiniGrid[70]等系统。树形 :一种层次结构,根智能体监督多个子智能体,子智能体又可管理子智能体,形成多级控制流。树形结构已在SoA[71]等框架中应用,支持任务委托和模块化问题解决。图结构 :一种通用通信结构,智能体以任意模式互连,包括完全图、随机图或任务特定的自定义拓扑[72],[73]。这种灵活的结构支持P2P交互和智能体间的动态协调。

b) 交互结构优化 :为了充分发挥IoA系统的潜力,根据任务特征优化交互模式和通信拓扑至关重要。

交互模式优化 :除了直接采用预定义的交互模式(如多智能体协作中的聚合和反思)[72],[74],[75],最近的研究广泛探索了交互模式的优化,以增强智能体间的协作。基于辩论的交互 :一项重要工作探索了基于辩论的交互。MAD框架[64]引入了非对称角色设计,智能体承担辩论者和评委等不同角色以评估论点。相比之下,Liang等人[40]提出了对称辩论结构,使智能体能够以平等身份进行对话以集体决策。这些范式已成功应用于机器翻译和数学推理等任务,产生了改进的结果。进一步的改进,如ReConcile[76],利用异构LLM的加权投票来提高决策质量。基于角色的协作交互 :另一个方向侧重于基于角色的协作交互模式。角色扮演智能体框架[47]使智能体能够围绕预定义的角色自组织,促进复杂场景中的自主合作。类似地,Park等人[22]开发了一个包含25个虚拟实体的沙盒环境,每个实体都具有记忆和个性特征,以模拟丰富的社会行为。Qian等人[68]利用基于聊天的软件开发框架,其中智能体承担软件工程角色,以较低成本协作完成全栈开发任务。除了协作讨论,一些工作还探索了社会对齐和自我协作范式。例如,Liu等人[77]构建沙盒环境以策划行为对齐的数据集,并训练具有增强社会对齐的LLM。Wang等人[78]提出了一种自我协作方法,其中单个LLM被提示以多人角色,在内部模拟多智能体通信。这减少了通信延迟,同时保留了角色多样性的好处。多机器人与实体智能体 :研究人员已将交互优化扩展到多机器人和实体环境中。Mandi等人[56]引入了一个框架,其中多个LLM控制单个机器人,促进协调规划和执行。通信拓扑优化 :优化智能体之间的通信拓扑对于提高IoA系统的协调和性能至关重要。该领域的研究已从早期的静态设计发展到动态、任务自适应和基于学习的方法。早期探索采用全连接拓扑,其中每个智能体在每个时间步与所有其他智能体通信[79]-[81]。尽管简单,但这种密集连接在复杂环境中由于通信开销过大和可扩展性有限而效率低下。修剪全连接拓扑 :已提出几种方法来修剪不必要的通信。例如,IC3NET[82]和Gated-ACML[83]引入了门控机制,学习单个智能体是否应参与通信。SchedNet[84]学习一个调度器,为每个智能体选择前K个智能体进行交互。ETCNET[57]在训练期间惩罚通信成本以促进稀疏连接。DC2Net[85]通过两个独立通道解耦个体和群体级通信,进一步减少开销。本地化与观察感知拓扑 :另一项工作探索了本地化和观察感知拓扑。在ATOC[86]中,动态选择的发起者从其观察领域中选择协作者。DGN[87]在局部可观察智能体上实现图卷积网络,实现结构化信息交换。LSC[88]将智能体聚类在预定义半径内以形成通信组,促进局部性和可扩展性。自适应与任务驱动通信结构 :最近的方法侧重于自适应和任务驱动的通信结构。例如,LLM-Blender[89]使用成对排名协调并行LLM交互,而任务特定分区[90],[91]分配工作负载并通过结构聚合合并输出。拓扑创新,如线性堆叠[92],[93]和动态DAGs[94],已应用于改进推理。为了自动化拓扑设计,DyLAN[44]自适应配置智能体组成,Archon[95]将协作框架化为超参数优化问题,GPTSwarm[73]使用RL学习智能体间连接。最先进的系统,如ADAS[96]和AFlow[97],使用LLM作为控制器,通过高级搜索算法探索拓扑变体。任务编排 :在IoA系统中,有效的任务编排对于智能体协作高效运行至关重要。这一过程不仅涉及将高层请求分解为子任务,还涉及根据智能体能力、环境上下文和资源可用性智能分配这些任务。任务编排的最新进展集中在两个关键方面:任务分解和任务分配。互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

a) 任务分解 :任务分解是IoA系统中任务分配的基础步骤,其中高层请求被分解为可管理和可执行的子任务。最近的进展可分为基于规则(或符号)的分解和基于学习的分解方法。

基于规则的分解 :基于经典的分而治之范式[106],基于规则的方法根据预定义的模式或逻辑结构显式解析任务,实现对复杂目标的细粒度控制。例如,TDAG[98]将任务解析与虚拟子智能体实例化相结合,在多步现实世界任务中实现自适应分解和灵活执行。HM-RAG[99]同样通过语义感知的查询重写和模式引导的增强,将复杂查询分解为上下文连贯的子任务。尽管这些方法具有强可解释性和控制性,但在动态变化的环境中面临挑战。基于学习的分解 :相比之下,基于学习的分解方法利用环境交互自动推断最佳分解策略。Shah等人提出了一个学习符号任务分解框架[107],该框架同时学习分解策略和子智能体策略,提高了样本效率,无需手动规则设计。此外,LLM的兴起将分解转变为数据驱动范式。HuggingGPT[100]就是一个典型例子,它构建了一个异构协作网络,将自然语言任务分解为多模态子任务,诊断准确率提高了19%。

b) 任务分配 :任务分解后,高效的任务-智能体分配对于有效的任务编排至关重要。现有方法可大致分为基于路由的分配和自组织分配策略。

基于路由的分配 :在基于路由的分配中,系统通过优化路由机制为给定任务动态选择最合适的智能 接上文翻译如下:

体或模型。RouteLLM[101]和Hybrid-LLM[102]等框架展示了模型选择路由的有效性,而RouterEval[103]则提供了路由质量的系统评估协议。这些方法具有高效性和可扩展性,但对路由策略的优化质量敏感。

自组织分配 :相比之下,自组织分配策略使智能体能够自主协调资源使用和任务分配。Mindstorms[104]引入了思维经济(EOM)范式,智能体基于人工经济框架自我调节计算资源,针对任务价值优化成本效率。Agora[105]进一步探索强化学习以优化智能体间的通信和协调。这种去中心化方法具有高度适应性,无需集中控制,但会引入协调开销和收敛不稳定性。自组织分配已应用于各种场景,包括协作代码生成[71]和共同进化的奖励共享机制[108],凸显了其在可扩展多智能体协作中的潜力。

总结与经验教训:在IoA中,精心设计的交互结构和任务编排是实现可扩展高效多智能体协作的基础。一方面,交互结构结合了交互模式和通信拓扑。交互模式(如聚合、反思、辩论和工具使用)定义了智能体如何共享、优化或挑战彼此的输出,而通信拓扑(如链式、星形、树形和图结构)塑造了效率、可扩展性和协调动态。最近的进展超越了固定设计,采用基于学习和任务驱动的方法,使通信模式和智能体角色能够适应上下文需求。另一方面,任务编排包括分解复杂任务并将子任务分配给合适的智能体。基于规则和基于学习的分解技术在可解释性和适应性之间提供了互补的权衡,而基于路由和自组织的任务分配策略平衡了集中式效率和分散式灵活性。尽管方法多样,但它们共享一个共同目标:在复杂环境中实现异构智能体之间的动态、自主和稳健合作。表VI总结了代表性的编排方法,突出了它们的策略、优势和局限性。

C. IoA的通信协议

传统上,大多数智能体框架仅考虑在自身生态系统内运行的智能体[7],[37],[41],[47],[52]-[54]。这种孤立的架构阻碍了互操作性,限制了第三方智能体的集成,无法反映智能体分布在异构设备和上下文中的现实场景。为了克服这些碎片化挑战,最近的工作侧重于标准化智能体通信协议,以支持消息交换、任务协商、上下文共享、身份管理以及与外部工具的集成,形成可扩展和互操作的IoA生态系统的支柱。代表性的智能体通信协议包括模型上下文协议(MCP)[13]、智能体到智能体(A2A)[9]、智能体网络协议(ANP)[46]、AGNTCY[109]和Agora[11],总结如表VII所示。

Anthropic的MCP :MCP由Anthropic发起,是一项开放标准,旨在实现LLM与外部工具、数据源和系统的无缝集成。通过提供统一接口并利用OAuth[110]进行授权,MCP允许智能体访问实时数据和服务,而不暴露用户凭证,从而增强上下文感知和响应相关性。

如图9所示,MCP采用客户端-服务器架构。主机(如Claude桌面)运行MCP客户端,连接到一个或多个MCP服务器[13]。每个服务器公开特定功能,分为工具(即可执行函数)、资源(如数据源)或预定义提示。典型的交互始于MCP客户端和服务器之间的协议协商和能力发现。客户端发送初始请求以检索服务器的可用能力,服务器相应响应。当客户端需要特定功能(如调用外部API)时,它向适当的MCP服务器发送请求。服务器执行相应的工具或检索相关资源,然后返回结果。主机将此输出集成到正在进行的交互中,实现更准确和上下文感知的响应。通过标准化此通信管道,MCP将模型行为与工具实现解耦,支持模块化、可扩展和跨平台的智能体工作流。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述 Google的A2A :与专注于将单个LLM与外部数据源和工具连接的MCP不同,Google的A2A协议作为网络层,促进异构AI智能体之间的无缝互操作性。它促进直接通信和知识共享,以进行任务协作。A2A默认纳入符合OpenAPI标准的企业级身份验证和授权机制[9],如OAuth 2.0和OpenID Connect。

A2A促进客户端智能体和远程智能体之间的通信[9],如图10所示。客户端智能体制定并传输任务,而远程智能体通过执行任务或提供相关信息进行响应。智能体协作始于客户端智能体通过检索智能体卡片发现远程智能体,智能体卡片是一种标准化的JSON文件,通常托管在知名URL上。此智能体卡片包含基本元数据,包括智能体的能力、技能、端点地址和身份验证要求,支持跨不同系统的结构化智能体发现。然后,客户端智能体通过通用唯一标识符(UUID)发送包含唯一任务ID的请求来发起任务。远程智能体根据其声明的能力处理任务。对于异步任务,随着任务进展,中间服务器发送事件(SSE)作为流,提供状态更新和部分响应。相比之下,同步任务在响应中直接返回最终结果。如果需要额外输入,客户端使用相同的任务ID发送后续消息,直到任务达到终止状态(如完成或失败)。

其他协议 :除了MCP和A2A,还有几种为IoA系统设计的新兴通信协议。ANP :ANP协议[46]定义了一个完全去中心化的P2P架构,其中每个智能体持有W3C DID[36]用于相互认证,并使用端到端加密保护所有消息。它还支持动态协议协商,以实现灵活高效的协作。AGNTCY :AGNTCY协议[109]侧重于构建开放和互操作的IoA基础设施。它基于智能体连接协议[111]构建,为智能体调用提供标准接口,并指定智能体能力和通信模式,促进标准化的智能体间协作。Agora :作为一个研究项目,Agora[11]为大规模IoA部署开发了一种可扩展的智能体通信协议。它为频繁通信采用标准化例程,并为不太频繁的交互利用自然语言或LLM生成的例程,旨在平衡智能体通信的多功能性、效率和可移植性[11]。混合智能体(MoA) :MoA[112]通过分层架构模拟“协作LLM”来增强智能体协调,其中每一层包含多个基于LLM的智能体,这些智能体具有相同的模型架构,将前一层的输出作为辅助上下文进行优化。

总结与经验教训:在IoA系统中,标准化通信协议对于实现异构智能体之间的互操作性至关重要,为可扩展和上下文感知的协作奠定了基础。值得注意的是,MCP通过统一接口为智能体提供对外部工具和资源的结构化标准化访问,而A2A强调P2P交互和动态智能体发现。同时,ANP专注于去中心化网络;AGNTCY采用混合架构促进标准化智能体间协作;Agora探索智能体集成,平衡效率、多功能性和可移植性;MoA针对面向任务的分层智能体编排。尽管架构和功能不同,这些协议共享一个共同目标:构建繁荣、可扩展和可信的IoA生态系统。表VII提供了它们的核心目标、架构设计、身份验证机制、智能体发现策略、支持实体、优势和局限性的比较总结。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

五、结论

在本文中,我们将IoA定位为下一代自主互联智能系统的基础设施,并对IoA进行了全面综述。具体而言,我们首先提供了分层的IoA架构,包括其核心组件、独特特征和新兴应用。随后,我们探讨了支撑大规模智能体协作的使能技术,包括能力发现、动态任务编排、自适应通信协议、共识机制和激励模型。最后,通过识别可扩展性、互操作性、智能体经济学、安全/隐私和伦理方面的开放性挑战,我们勾勒了未来IoA研究的路线图。随着IoA的不断成熟,网络架构、互操作性标准和安全范式的持续创新对于实现IoA生态系统至关重要。

互联网核心科技是什么 精智能体互联网(The Internet of Agents)全面综述

作者:张长旺,图源:旺知识

参考资料

标题 :The Internet of Agents: Foundations, Applications, and Challenges作者 :Yuntao Wang, Shaolong Guo, Yanghe Pan, Zhou Su, Fahao Chen, Tom H. Luan, Peng Li, Jiawen Kang, Dusit Niyato单位 :西安交通大学,日本会津大学,南洋理工大学标签 :智能体互联网、智能体网络、大型模型、人工智能智能体、多智能体系统、通信协议、任务编排概述 :文章全面综述智能体互联网(IoA),介绍其架构、关键特征、与传统网络区别、应用场景,探讨工作范式中的各项技术,指出未来研究方向。链接 :https://arxiv.org/pdf/2505.07176

工业互联网:核心产业规模超 15 万亿

【工业互联网发展成效显著!】 近年来,在社会各界共同努力下,我国工业互联网发展成果斐然。工业互联网核心产业规模超 1.5 万亿元,带动增长近 3.5 万亿元。工业互联网已拓展至 49 个国民大类,实现 41 个工业大类全覆盖,标识解析注册量突破 6500 亿个,连接工业设备超 1 亿台套。工信部总工程师谢少锋称,将推动工业互联网与人工智能协同赋能、融合发展,夯实互联互通基础,建设高质量工业数据集,推动建设工业领域专业大模型,加快智能算力建设布局,依托工业互联网平台推进人工智能赋能新型工业化。此次大会以“数智创新深化赋能高质量推进新型工业化”为主题,由中国信息通信研究院、苏州市人民政府共同主办。

相关问答

因而“国际互联网”也成为当今世界人们关注的焦点。据此完...

1.下列关于“国际互联网”的说法,正确的是()A.是当前信息领域发展最快、作用最大、影响最广的通信网络B.电子商务与国际互联网都是“信息高速公路”的具体体...

互联网的核心是什么?

传统企业与互联网企业是两套不同的思维逻辑,传统企业是交易,而互联网企业是营销。锁定客户的差异传统企业主要是生产和升级产品,只有客户主动接触,产品才能...

互联网的核心基础是什么?

互联网的核心和基础是云计算。云计算(cloudcomputing)是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多...

互联网时代最核心的资源是什么?

核心资源是用户。互联网(internet),又称国际网络,指的是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协议相连,形成逻辑上的单一巨大国际网络...

互联网的核心和基础是什么?

互联网的核心和基础是通信和信息交换。它通过全球范围内的互连网络,将各种类型的数据和信息传输到世界各地。互联网的基础是建立在网络协议、数据传输和存储技...

互联网时代最重要的思维方式?

1、用户思维;要在价值链各个环节中都要“以用户为中心”去考虑问题。2、简约思维;互联网时代,信息爆炸,用户的耐心越来越不足,所以,必须在短时间内抓住...

中关村互联网是什么?

中关村互联网是一个北京市海淀区的科技园区,它是中国互联网产业的一个主要集聚地。1.中关村互联网是国家级高新技术产业开发区,集聚了大量的互联网科技公司和...

互联网创新思维由哪些核心理论构成?

互联网思维的四个核心观点(用户至上、体验为王、免费的商业模式、颠覆式创新)和九大思维(用户思维、简约思维、极致思维、迭代思维、流量思维、社会化思维、大...

互联网核心思路的新技术包含哪些?

互联网核心思路的新技术包括:“一硬(工业控制)+一软(工业软件)+一网(工业网络)+一安全(工业信息安全)”四大基础技术,“边缘智能+工业大数据分析+工业机理建模...

互联网工厂的核心和本质是什么?

就是产品直接到用户手里!以前是产品,总代,一级经销商,二级经销商,三四级经销商等等,这样一层一层的,到用户手里面,价格也很高了!互联网工厂,直接给用户...就...

抱歉,评论功能暂时关闭!