谷歌新发布的A2A协议，要吃掉MCP？

302 0 0

文章摘要

谷歌近日发布了名为Agent2Agent（A2A）的Agent互操作协议，并与包括Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、Salesforce、SAP、ServiceNow、UKG和Workday在内的50多家公司合作，旨在将A2A打造为Agent之间的通用互操作语言。这一举措类似于10年前谷歌发布Kubernetes的场景，表明企业逐渐意识到推出协议或标准有助于推动业务发展，并构建“护城河”。如果A2A成为代理通信的事实标准，整个LLM生态系统将向谷歌的服务敞开大门，迫使其他公司要么推出自己的标准，要么接受谷歌的方案。

A2A与模型上下文协议（MCP）是互补关系，而非替代关系。MCP是连接LLM与数据、资源和工具的标准，旨在降低智能体与工具和数据连接的复杂性。而A2A则是一个应用层协议，专注于使Agent能够以自然的方式协作，允许Agent以“Agent”的身份进行交流，而不是作为工具。谷歌希望A2A能够作为MCP的补充被广泛采用，推动Agent生态系统的发展，并与社区开放合作实现这一目标。

通过一个汽车修理厂的例子可以更好地理解两者的区别。MCP是将智能体与其结构化工具连接的协议，例如“将平台升高2米”或“将扳手向右转动4毫米”。而A2A则是使终端用户或其他智能体能够与修理厂员工协作的协议，例如“我的车发出咔哒咔哒的声音”。A2A支持持续的双向交流和不断演进的计划以达成目标，例如“发我一张左轮的照片”或“我注意到有液体在漏，这种情况持续多久了？”此外，A2A还帮助修理厂员工与其他智能体（如零件供应商）协作。

尽管A2A并非市场上唯一的互操作协议，例如由Cisco、LangChain、Galileo、LlamaIndex和Glean等公司推出的AGNTCY也意图成为Agent通信的标准，但A2A为不同的Agent提供了标准化的通信方式，使它们能够像人类团队一样分工合作、实时沟通，并根据用户的设备和界面能力灵活调整交互方式。

根据谷歌的官方介绍，A2A协议包含几个关键能力：能力发现、任务管理、协作和用户体验协商。每个Agent可以通过“Agent Card”公开自己的能力，Client Agent可以根据这些信息识别最适合执行某项任务的Remote Agent，并通过A2A协议与其建立通信。任务管理以“完成任务”为核心，任务对象具有完整的生命周期，Agent之间可以持续同步状态，确保彼此了解任务的最新进展。协作方面，Agent之间可以互发消息，传递上下文信息、用户指令、任务结果等，实现真正的多Agent协同工作。用户体验协商则允许Agent之间就内容的展示格式进行协商，以适配用户界面的能力。

谷歌还提供了一个案例，展示了A2A在招聘流程中的应用。借助A2A协作，招聘经理可以指派自己的Agent寻找符合职位描述、地点和技能要求的候选人，与其他专门的Agent交互，从多个渠道获取潜在候选人，并进一步安排面试和背景调查，从而简化整个人才筛选流程。

谷歌推出的A2A协议是实现AI Agent互操作性未来的重要一步。由于没有任何单一工具能掌握用户或企业大多数工作流程所需的全部数据，因此Agent之间能够相互沟通变得至关重要。Salesforce、Workday、Notion等公司各自拥有理解不同业务流程的AI Agent，未来可能涌现出成千上万的工具型Agent以及数十亿甚至数万亿个定制化的Agent。完成一个任务的工作流程通常需要来自多个系统的数据，这正是A2A发挥作用的地方，它简化了Agent之间的交流，推动了AI Agent生态系统的进一步发展。