N×M 困境 · JSON-RPC 架构 · MCP vs REST · 四大厂商入局 · 六步落地 Runbook
给 Claude、GPT、Gemini 各写一套 CRM 适配层?N 个模型 × M 个工具的集成噩梦,像极了 TCP/IP 出现前各网络互不兼容的混沌。Anthropic 于 2024 年 11 月开源的 Model Context Protocol(MCP),正被比作 AI 工具集成领域的 USB-C——统一「AI 如何发现、选择并调用工具」的语言。本文面向 Agent 开发者与技术负责人:拆解 N×M 困境与 MCP 三层架构、对比 MCP vs REST、梳理 2026 年四大厂商入局时间线与 10000+ Server 生态数据,并给出六步 MCP Server 落地 Runbook。
1970 年代,ARPAnet、Ethernet、分组无线网络各自为政,每次跨网连接都要定制翻译层,成本高且易出错。TCP/IP 定义统一通信规则后,HTTP 再次抽象,万维网才得以爆发。2024 年之前的 AI 世界,正处于同一种混沌:每个模型、每个 IDE、每个 Agent 框架都有自己的工具接入方式。
现代 LLM 有天然边界:训练数据截止、无法访问实时信息、无法直接执行操作。解法是给 AI 接上「手脚」——Tool Use / Function Calling。但现实是:ChatGPT 有 Plugins 格式,OpenAI 有 Function Calling,Claude 有 Tool Use,LangChain、CrewAI、Cursor 各自定义数据接入——一旦更换模型供应商,集成逻辑往往要推倒重来。
企业 CRM 接入 AI:需为 Claude、GPT、Gemini 分别开发适配层,三套 schema、三套鉴权、三套运维。
IDE 中的 AI 助手:访问文件系统、数据库、内部 API 的方式因产品而异,无法跨 IDE 复用。
Agent 编排框架:工具定义无法跨 LangChain、CrewAI 复用,编排资产绑定框架而非团队。
供应商锁定:集成逻辑与特定模型 API 形态耦合,换模型 = 重写工具层。
成本线性膨胀:N 个模型 × M 个外部工具 = N×M 个定制化集成,维护面随规模指数恶化。
USB-C 出现前,充电口五花八门;MCP 要做的,就是 AI 工具集成领域的 USB-C——设备无需关心对方是谁,开口说同一种语言。
Model Context Protocol(MCP) 是 Anthropic 于 2024 年 11 月正式开源的一套开放标准,定义 AI 模型(客户端)与外部工具/数据(服务端)之间通信的统一规范。核心思想:将「AI 能发现哪些工具、如何调用它们」这件事标准化。
Host(宿主层)如 Claude Desktop、Cursor、VS Code,内嵌 MCP Client,为每个 MCP Server 维护 1:1 会话连接。Client 通过 JSON-RPC 2.0 与 MCP Server 通信;Server 暴露三类能力:Tools(可执行操作)、Resources(只读数据)、Prompts(复用模板),再对接数据库、API、文件系统等外部系统。
| 传输方式 | 适用场景 | 特点 |
|---|---|---|
| STDIO | 本地子进程 | 零依赖、启动快、隔离性好 |
| HTTP + SSE | 远程/云端服务 | 跨网络调用、支持水平扩展 |
{
"jsonrpc": "2.0",
"method": "tools/call",
"params": {
"name": "query_database",
"arguments": { "sql": "SELECT * FROM users LIMIT 10" }
},
"id": 1
}
关键 RPC 方法:tools/list 运行时动态获取可用工具清单;resources/read 读取文件或数据库记录;Server 还可主动向 Client 推送消息,区别于传统 REST 的单向请求。
| 维度 | 传统 REST API | MCP |
|---|---|---|
| 工具发现 | 开发者读文档、硬编码调用 | Agent 启动时 tools/list 实时获取清单 |
| 会话状态 | 无状态,每次请求独立 | 持久连接保持上下文,支持多步工作流 |
| 自描述 | API 不会告诉 AI 自己能做什么 | 每个工具附带 JSON Schema,含参数含义与副作用 |
| 通信方向 | 单向请求-响应 | 双向:Server 可反向要求 LLM 推理或向用户请求补充信息 |
| 集成规模 | N×M 定制化集成 | 写一次 Server,所有 MCP Client 可用 |
REST API 解决的是「能不能调用」;MCP 解决的是「AI 如何发现、选择并正确调用工具」——这才是 Agent 时代的核心命题。
以下路径在 Cursor 与 Claude Desktop 均适用:先本地 STDIO 验证,再视需要升级为 HTTP+SSE 远程部署。目标是把「只为一个模型写的工具胶水」变成可移植的 MCP 资产。
选定一个原子能力:从团队最高频的外部依赖入手——如内部工单 API、只读 Postgres 查询、或 GitHub PR 状态——避免首版就做「万能网关」。
用官方 SDK 脚手架生成 Server:按语言选用 MCP SDK(TypeScript / Python 等),实现 tools/list 与 tools/call,为每个 tool 写清 JSON Schema 与副作用说明。
本地 STDIO 联调:在 Cursor 的 MCP 配置中注册 Server 命令行入口,重启后确认 Agent 能发现并调用;用 3 条正例 prompt 验证参数传递与错误回传。
补充 Resources / Prompts(可选):把只读文档、schema 快照暴露为 resources/read;把重复性多步提示沉淀为 prompts 模板,减少 Agent 即兴发挥。
安全与权限收口:Server 层集中鉴权(API Key / OAuth 2.0 路线图项),禁止把密钥写进 tool schema;对写操作加 allowlist 与审计日志。
生产部署与观测:需要 7×24 或多客户端共享时,切 HTTP+SSE 远程模式;监控 tools/call 延迟、失败率与 session 亲和,必要时在 Mac 宿主上用 launchd 守护进程。
提示:MCP Server 写完即可被所有兼容 Client 使用——今天接 Cursor,明天换 Claude Desktop 或 VS Code,工具层无需改写。这与「为每个模型写 Function Calling 适配」形成鲜明对比。
2024 年 LLM 能力突破阈值,Agent 成为主流范式,工具调用碎片化问题极度尖锐——MCP 在正确的时间点提供了正确的抽象。Anthropic 作为顶级 AI 安全研究公司开源规范,Claude 率先集成形成参考实现,社区雪球迅速滚动。
| 时间 | 里程碑 |
|---|---|
| 2024 年 11 月 | Anthropic 开源 MCP 规范 |
| 2025 年 | Cursor、Zed、Continue 等 IDE 原生支持 |
| 2026 年 Q1 | OpenAI 宣布采用 MCP(1 月) |
| 2026 年 Q2 | Google DeepMind CEO 宣布 Gemini 支持 MCP(2 月) |
| 2026 年 Q2 | Microsoft 完成支持;治理权移交 Linux Foundation 旗下 Agentic AI Foundation(AAIF) |
从「一家公司的私有标准」到「行业公共基础设施」——治理权移交 AAIF,类比互联网协议由 IETF 治理,MCP 真正成为属于全行业的协议。截至 2026 年,MCP 生态已有超过 10,000 个 MCP Server:每新增一个 Server,所有支持 MCP 的 Client 立即可用;每新增一个 Client,所有已有工具立即可被接入——这正是 HTTP 当年奠定 Web 生态的同一种网络效应。
Google 推出的 Agent-to-Agent(A2A) 协议定义 AI Agent 之间的通信规范。二者不是竞争,而是不同层级:MCP 负责 AI 模型 ↔ 工具/数据(垂直集成层);A2A 负责 AI Agent ↔ AI Agent(横向编排层)。两者共同构成 Agent 互联网的协议栈。
注意:MCP 尚未完美。OAuth 2.0/2.1 标准化身份验证列入 2026 路线图;尚无统一「MCP 服务器注册表」(类比没有 DNS 的互联网);SSE 传输需 session affinity;约 1000 个 MCP Server 处于暴露且未授权状态,间接提示注入攻击已被记录——生产部署务必做权限收口。
对开发者:MCP Server 写一次、到处跑,可自由切换底层 LLM(Claude → GPT → Gemini),工具层不变。行业调研显示,企业 AI 集成开发成本降幅约 38–55%;标准化接口降低新创公司进入门槛约 62%,而传统系统集成商的定制化需求减少约 43%。垂直领域专属 MCP Server 仍是蓝海。
tools/list 运行时动态拉取。HTTP 没有发明浏览器,但没有 HTTP 就没有浏览器生态;TCP/IP 没有发明邮件,但没有 TCP/IP 就没有 Email。MCP 没有发明 AI Agent,但它正在成为 AI Agent 生态能够存在的基础设施。多年后回望,2024 年 11 月 Anthropic 开源 MCP 规范这一刻,可能正是 AI 时代的「HTTP 诞生时刻」。
笔记本适合做 MCP Server 的 POC,却在合盖休眠、缺少 macOS 原生工具链与长期进程守护上削弱 7×24 体验;纯 Linux VPS 能跑远程 HTTP+SSE Server,却难以承载依赖 Keychain、Xcode 或 Apple 生态的 MCP 工具。对要把多个 MCP Server 当「常驻基础设施」、让 Agent 跨周累积工具调用复利的技术团队,VpsMesh Mac Mini M4 云端租赁把 uptime、远程 KVM 与可预期月租打包成生产级 OpEx——比反复重装开发机更省时间。套餐见 Mac Mini M4 租赁价格,部署问题见 帮助中心,在线下单见 订购页。
REST API 解决「能不能调用」:开发者读文档、硬编码 endpoint。MCP 解决「AI 如何发现、选择并正确调用工具」:Agent 通过 tools/list 运行时获取清单,每个 tool 附带 JSON Schema 自描述,并支持有状态会话与 Server 反向推送。N×M 定制化集成在 MCP 下收敛为「写一次 Server、多 Client 复用」。
MCP 是垂直层:AI 模型 ↔ 工具/数据(数据库、API、文件系统)。Google 的 A2A(Agent-to-Agent) 是横向层:AI Agent ↔ AI Agent 的编排与协作。二者互补,共同构成 Agent 互联网协议栈——就像 HTTP 之上还有 WebSocket、SMTP 等不同层协议各司其职。
不必须。纯 STDIO 本地 Server 可在开发机验证;远程 HTTP+SSE 也可部署在 Linux 云主机。若 MCP 工具链依赖 macOS 原生能力、Keychain 或你希望 Cursor Agent 与多个 Server 7×24 不被合盖打断,Mac Mini M4 月租更省心。建议先租 1 个月验证 tools/call 调用曲线,套餐见 Mac Mini M4 租赁价格,下单见 订购页。