N×M 딜레마 · JSON-RPC 아키텍처 · MCP vs REST · 4대 벤더 진입 · 6단계 Runbook
Claude, GPT, Gemini마다 CRM 어댑터를 따로 작성하시겠습니까? N개 모델 × M개 도구의 통합 악몽은 TCP/IP 등장 이전 서로 호환되지 않던 네트워크의 혼란과 닮아 있습니다. Anthropic이 2024년 11월 오픈소스로 공개한 Model Context Protocol(MCP)은 AI 도구 통합 분야의 USB-C로 불리며, 「AI가 도구를 어떻게 발견·선택·호출하는가」를 하나의 언어로 통일합니다. 본 글은 Agent 개발자와 기술 책임자를 대상으로 N×M 딜레마와 MCP 3계층 아키텍처를 해설하고, MCP vs REST를 비교하며, 2026년 4대 벤더 진입 타임라인과 10000+ Server 생태 데이터를 정리하고, 6단계 MCP Server 구축 Runbook을 제공합니다.
1970년대 ARPAnet, Ethernet, 패킷 무선망은 각자 제멋대로였고, 네트워크를 넘을 때마다 맞춤 번역 계층이 필요해 비용과 오류가 컸습니다. TCP/IP가 통신 규칙을 통일한 뒤 HTTP가 한 번 더 추상화하면서 월드와이드웹이 폭발적으로 성장했습니다. 2024년 이전 AI 세계도 같은 혼란 상태였습니다. 모델, IDE, Agent 프레임워크마다 도구 연결 방식이 달랐습니다.
현대 LLM에는 본질적 한계가 있습니다. 학습 데이터 시점 제한, 실시간 정보 접근 불가, 직접 실행 불가입니다. 해결책은 AI에 「손발」을 연결하는 Tool Use / Function Calling입니다. 그러나 현실은 ChatGPT Plugins, OpenAI Function Calling, Claude Tool Use, LangChain·CrewAI·Cursor 각자의 데이터 접근 방식이 공존합니다. 모델 공급사를 바꾸면 통합 로직을 처음부터 다시 짜야 하는 경우가 많습니다.
기업 CRM AI 연동: Claude, GPT, Gemini용 어댑터를 각각 개발해야 하며, 스키마·인증·운영이 세 벌로 갈립니다.
IDE AI 어시스턴트: 파일 시스템, 데이터베이스, 내부 API 접근 방식이 제품마다 달라 IDE 간 재사용이 어렵습니다.
Agent 오케스트레이션 프레임워크: 도구 정의가 LangChain, CrewAI 간 공유되지 않아 자산이 팀이 아니라 프레임워크에 묶입니다.
벤더 종속: 통합 로직이 특정 모델 API 형태에 결합되어 모델 교체 시 도구 계층을 재작성해야 합니다.
비용의 선형 팽창: N개 모델 × M개 외부 도구 = N×M개 맞춤 통합이며, 규모가 커질수록 유지 부담이 기하급수적으로 악화됩니다.
USB-C 이전에는 충전 단자가 제각각이었습니다. MCP가 하려는 일은 AI 도구 통합 분야의 USB-C입니다. 장치는 상대가 누구인지 몰라도 같은 언어로 말할 수 있습니다.
Model Context Protocol(MCP)은 Anthropic이 2024년 11월 정식 오픈소스로 공개한 개방 표준으로, AI 모델(클라이언트)과 외부 도구/데이터(서버) 간 통신 규격을 정의합니다. 핵심은 「AI가 어떤 도구를 발견하고 어떻게 호출하는가」를 표준화하는 것입니다.
Host(호스트 계층)인 Claude Desktop, Cursor, VS Code는 내장 MCP Client를 통해 각 MCP Server와 1:1 세션을 유지합니다. Client는 JSON-RPC 2.0으로 MCP Server와 통신하며, Server는 Tools(실행 가능 작업), Resources(읽기 전용 데이터), Prompts(재사용 템플릿) 세 가지 능력을 노출하고 데이터베이스·API·파일 시스템 등 외부 시스템에 연결합니다.
| 전송 방식 | 적합 시나리오 | 특징 |
|---|---|---|
| STDIO | 로컬 자식 프로세스 | 의존성 없음, 빠른 기동, 격리성 우수 |
| HTTP + SSE | 원격/클라우드 서비스 | 네트워크 호출, 수평 확장 지원 |
{
"jsonrpc": "2.0",
"method": "tools/call",
"params": {
"name": "query_database",
"arguments": { "sql": "SELECT * FROM users LIMIT 10" }
},
"id": 1
}
핵심 RPC 메서드는 tools/list로 런타임에 사용 가능한 도구 목록을 동적으로 가져오고, resources/read로 파일이나 데이터베이스 레코드를 읽습니다. Server는 Client에 능동적으로 메시지를 푸시할 수 있어 전통 REST의 단방향 요청과 다릅니다.
| 차원 | 전통 REST API | MCP |
|---|---|---|
| 도구 발견 | 개발자가 문서를 읽고 하드코딩 | Agent 기동 시 tools/list로 실시간 목록 획득 |
| 세션 상태 | 무상태, 요청마다 독립 | 지속 연결로 컨텍스트 유지, 다단계 워크플로 지원 |
| 자기 기술 | API가 AI에게 자신의 역량을 알려주지 않음 | 각 도구에 JSON Schema, 파라미터 의미, 부작용 포함 |
| 통신 방향 | 단방향 요청-응답 | 양방향: Server가 LLM 추론 또는 사용자 추가 정보를 요청 가능 |
| 통합 규모 | N×M 맞춤 통합 | Server 한 번 작성, 모든 MCP Client에서 사용 |
REST API는 「호출할 수 있는가」를 해결하고, MCP는 「AI가 도구를 발견·선택·올바르게 호출하는가」를 해결합니다. 이것이 Agent 시대의 핵심 과제입니다.
아래 경로는 Cursor와 Claude Desktop 모두에 적용됩니다. 먼저 로컬 STDIO로 검증한 뒤 필요 시 HTTP+SSE 원격 배포로 전환하세요. 목표는 「한 모델 전용 도구 접착제」를 이식 가능한 MCP 자산으로 바꾸는 것입니다.
원자적 능력 하나 선정: 팀이 가장 자주 쓰는 외부 의존성부터 시작하세요. 내부 티켓 API, Postgres 읽기 전용 쿼리, GitHub PR 상태 등이 적합하며, 첫 버전에서 「만능 게이트웨이」는 피하세요.
공식 SDK로 Server 스캐폴드: 언어에 맞는 MCP SDK(TypeScript / Python 등)로 tools/list와 tools/call을 구현하고, 각 tool에 JSON Schema와 부작용 설명을 명확히 작성하세요.
로컬 STDIO 연동: Cursor MCP 설정에 Server CLI 진입점을 등록하고 재시작 후 Agent가 발견·호출하는지 확인하세요. 정상 prompt 3건으로 파라미터 전달과 오류 반환을 검증하세요.
Resources / Prompts 보강(선택): 읽기 전용 문서, schema 스냅샷을 resources/read로 노출하고, 반복 다단계 프롬프트를 prompts 템플릿으로 축적해 Agent 즉흥 발화를 줄이세요.
보안·권한 통제: Server 계층에서 API Key / OAuth 2.0(로드맵) 인증을 집중하고, tool schema에 키를 넣지 마세요. 쓰기 작업에는 allowlist와 감사 로그를 적용하세요.
프로덕션 배포·관측: 7×24 또는 다중 Client 공유가 필요하면 HTTP+SSE 원격 모드로 전환하세요. tools/call 지연, 실패율, session affinity를 모니터링하고, Mac 호스트에서는 launchd 데몬을 고려하세요.
팁: MCP Server를 작성하면 모든 호환 Client에서 사용할 수 있습니다. 오늘 Cursor에 연결하고 내일 Claude Desktop이나 VS Code로 바꿔도 도구 계층을 다시 작성할 필요가 없습니다. 「모델마다 Function Calling 어댑터 작성」과 대조됩니다.
2024년 LLM 역량이 임계점을 넘으면서 Agent가 주류 패러다임이 되었고, 도구 호출 파편화 문제가 극도로 날카로워졌습니다. MCP는 적절한 시점에 적절한 추상화를 제공했습니다. Anthropic이 최상위 AI 안전 연구 기관으로서 규격을 오픈소스로 공개하고 Claude가 먼저 통합해 참조 구현을 만들었으며, 커뮤니티 눈덩이가 빠르게 커졌습니다.
| 시기 | 마일스톤 |
|---|---|
| 2024년 11월 | Anthropic MCP 규격 오픈소스 공개 |
| 2025년 | Cursor, Zed, Continue 등 IDE 네이티브 지원 |
| 2026년 Q1 | OpenAI MCP 채택 발표(1월) |
| 2026년 Q2 | Google DeepMind CEO Gemini MCP 지원 발표(2월) |
| 2026년 Q2 | Microsoft 지원 완료, 거버넌스 Linux Foundation Agentic AI Foundation(AAIF) 이관 |
「한 회사의 사유 표준」에서 「업계 공공 인프라」로——거버넌스가 AAIF로 이관된 것은 인터넷 프로토콜이 IETF에서 관리되는 것과 유사하며, MCP가 진정한 업계 전체의 프로토콜이 되었음을 의미합니다. 2026년 기준 MCP 생태에는 10,000개 이상의 MCP Server가 있습니다. Server가 하나 추가되면 MCP를 지원하는 모든 Client가 즉시 사용할 수 있고, Client가 추가되면 기존 모든 도구에 즉시 접근할 수 있습니다. 이것이 HTTP가 Web 생태를 만든 것과 같은 네트워크 효과입니다.
Google의 Agent-to-Agent(A2A) 프로토콜은 AI Agent 간 통신 규격을 정의합니다. 둘은 경쟁이 아니라 서로 다른 계층입니다. MCP는 AI 모델 ↔ 도구/데이터(수직 통합 계층)를, A2A는 AI Agent ↔ AI Agent(수평 오케스트레이션 계층)를 담당합니다. 두 프로토콜은 함께 Agent 인터넷 프로토콜 스택을 구성합니다.
주의: MCP는 아직 완벽하지 않습니다. OAuth 2.0/2.1 표준 인증은 2026 로드맵에 포함되어 있고, DNS에 비유할 통합 「MCP Server 레지스트리」는 없으며, SSE 전송은 session affinity가 필요합니다. 약 1000개 MCP Server가 노출·무인증 상태이며 간접 프롬프트 인젝션 공격 사례도 기록되었습니다. 프로덕션 배포 시 반드시 권한을 통제하세요.
개발자 관점에서 MCP Server는 한 번 작성하면 어디서나 실행되며, 하위 LLM을 Claude → GPT → Gemini로 자유롭게 전환해도 도구 계층은 그대로입니다. 업계 조사에 따르면 기업 AI 통합 개발 비용은 약 38–55% 감소하고, 표준화 인터페이스는 신규 진입 장벽을 약 62% 낮추며, 전통 SI의 맞춤 요구는 약 43% 줄어듭니다. 수직 도메인 전용 MCP Server는 여전히 블루오션입니다.
tools/list 런타임 동적 조회.HTTP가 브라우저를 발명하지는 않았지만 HTTP 없이는 브라우저 생태가 없었습니다. TCP/IP가 이메일을 발명하지는 않았지만 TCP/IP 없이는 Email도 없었습니다. MCP는 AI Agent를 발명하지 않았지만, AI Agent 생태가 존재할 수 있는 인프라가 되고 있습니다. 수년 뒤 돌아보면 2024년 11월 Anthropic이 MCP 규격을 오픈소스로 공개한 이 순간이 AI 시대 「HTTP 탄생의 순간」일 수 있습니다.
노트북은 MCP Server POC에 적합하지만, 뚜껑을 닫으면 슬립되고 macOS 네이티브 도구체인과 장기 프로세스 데몬이 부족해 7×24 경험이 약해집니다. 순수 Linux VPS는 원격 HTTP+SSE Server를 돌릴 수 있지만 Keychain, Xcode, Apple 생태에 의존하는 MCP 도구는 어렵습니다. 여러 MCP Server를 「상주 인프라」로 두고 Agent가 주 단위로 도구 호출 복리를 쌓으려는 기술 팀에게 VpsMesh Mac Mini M4 클라우드 렌탈은 uptime, 원격 KVM, 예측 가능한 월 비용을 프로덕션 OpEx로 묶어 개발 머신을 반복 재설치하는 것보다 시간을 절약합니다. 요금은 Mac Mini M4 대여 가격, 배포 문의는 고객 센터, 주문은 주문 페이지에서 확인하실 수 있습니다.
REST API는 「호출할 수 있는가」를 해결합니다. 개발자가 문서를 읽고 endpoint를 하드코딩합니다. MCP는 「AI가 도구를 발견·선택·올바르게 호출하는가」를 해결합니다. Agent가 tools/list로 런타임 목록을 가져오고, 각 tool에 JSON Schema 자기 기술이 첨부되며, 상태ful 세션과 Server 역방향 푸시를 지원합니다. N×M 맞춤 통합은 MCP에서 「Server 한 번 작성, 다중 Client 재사용」으로 수렴합니다.
MCP는 수직 계층으로 AI 모델 ↔ 도구/데이터(데이터베이스, API, 파일 시스템)를 연결합니다. Google A2A(Agent-to-Agent)는 수평 계층으로 AI Agent ↔ AI Agent 오케스트레이션과 협업을 담당합니다. 둘은 상호 보완하며 Agent 인터넷 프로토콜 스택을 구성합니다. HTTP 위에 WebSocket, SMTP 등 각 계층 프로토콜이 역할을 나누는 것과 같습니다.
필수는 아닙니다. 순수 STDIO 로컬 Server는 개발 머신에서 검증할 수 있고, 원격 HTTP+SSE는 Linux 클라우드에도 배포 가능합니다. MCP 도구체인이 macOS 네이티브 기능, Keychain에 의존하거나 Cursor Agent와 여러 Server를 뚜껑을 닫아도 7×24 중단 없이 운영하려면 Mac Mini M4 월 렌탈이 더 편리합니다. 1개월 렌탈로 tools/call 호출 곡선을 먼저 검증하세요. 요금은 Mac Mini M4 대여 가격, 주문은 주문 페이지에서 확인하실 수 있습니다.