28.9T 주간 호출량 · 중미 격변 · DeepSeek 매트릭스 1위 · 토큰 vs 달러 · 6단계 주간 추적
MMLU 순위와 프로덕션 체감 사이에서 갈팡질팡하며 「2026년에 실제로 누가 호출되는지」 알고 싶다면, OpenRouter Rankings의주간 토큰 처리량이 Benchmark보다 정직합니다. 2026년 5월 24일 주 기준 글로벌 주간 호출량은 28.9조 토큰(5주 연속 증가)이며, 중국 모델은 9.223T로 4주 연속 미국을 앞섰습니다. DeepSeek 3개 모델 합계 5.74T가 벤더 1위입니다. 본문은 모델 라우팅과 비용 통제를 담당하는 개발자·기술 리더를 위해 데이터 출처, 해당 주 Top 10, 토큰 점유 vs 달러 매출, a16z 벤치마크 역전, 6단계 주간 추적 Runbook, 장기 Agent 운영 시 Mac Mini M4 월세의 의미를 제공합니다.
OpenRouter는 최대 규모의 중립 AI 모델 API 집약 플랫폼으로 300+ 모델, 60+ 공급자, 800만+ 사용자, 월 약 100조 토큰을 처리합니다. 공개 순위(openrouter.ai/rankings)는 7일 롤링 토큰 처리량으로 집계하며 입·출력 모두 포함합니다. 개발자가 「돈으로 투표」한 결과이지 벤더 레이더 차트가 아닙니다.
1년 전 주간 처리량은 약 2.4조, 현재 한 주에 28.9조로 약 12배 성장했습니다. 토큰 호출량은 AI 상용화의 바로미터가 되었습니다.
Benchmark는 최적화될 수 있습니다: MMLU·HumanEval 고득점이 Agent 워크플로의 XML/JSON 도구 호출 안정성이나 30분 자율 코딩을 보장하지 않습니다.
호출량은 프로덕션 채택 의지: 개발자가 지속 과금하는 것은 안정성·응답 속도·가성비가 검증됐기 때문입니다.
주간 단위가 트렌드를 포착: DeepSeek V4-Flash 주간 +66% 같은 급등은 월간 집계에서 평활됩니다.
무료 모델이 인식을 왜곡: Owl Alpha 등 0원 모델은 실험 트래픽을 키웁니다. 토큰 점유와 달러 매출 점유를 함께 보세요.
프로그래밍이 최대 단일 용도: OpenRouter + a16z 보고(100조 토큰 메타데이터)에서 코딩 비중이 2025년 초 11%에서 50% 초과로 급증했습니다.
가장 똑똑한 모델이 아니라 가장 많이 호출되는 모델이 AI 도입을 이끕니다. 청구 숫자는 어떤 평가 순위보다 정직합니다.
아래 표는 OpenRouter 공개 데이터(7일 롤링 주간, 2026년 5월 24일 기준) 요약입니다. 每日经济新闻(2026-05-25), OpenRouter 공식, MACCOME 동기 해설과 대조했습니다.
| 지표 | 수치 | 전주 대비 |
|---|---|---|
| 글로벌 주간 호출량 | 28.9조 토큰 | +7.4%(5주 연속 증가) |
| 중국 모델 주간 | 9.223조 토큰 | +19.89% |
| 미국 모델 주간 | 4.93조 토큰 | +16.27% |
| 중미 순위 | 중국 4주 연속 미국 초과 | 글로벌 1위 지역 |
| 시점 | 중국 모델 트래픽 점유 |
|---|---|
| 2025년 초 | < 2% |
| 2026년 2월 | 처음 미국 초과 |
| 2026년 5월 | ~45%+, 4주 연속 미국 초과 |
집계 기준: OpenRouter는 모델 소속 벤더로 지역 점유를 집계합니다. DeepSeek, Tencent, MiniMax, StepFun은 중국, Anthropic, Google, xAI는 미국 측입니다.
2026년 5월 18–24일 주간 토큰 순위입니다. DeepSeek V4-Flash, V4-Pro, V3.2가 모두 Top 9에 들어 시리즈 합계 5.74T(전주 +25.9%)로 2주 연속 Anthropic·Google을 제치고 벤더 1위입니다. 전주 6위 Kimi K2.6는 Top 10에서 이탈했습니다.
| 순위 | 모델 | 벤더 | 주간 토큰 | 전주 대비 | 특징 |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek | 3.43T | +66% | Agent 워크플로, 초저가 |
| 2 | Tencent Hy3 Preview | Tencent | 3.07T | +16% | 무료 종료 후에도 고성장 |
| 3 | Claude Sonnet 4.6 | Anthropic | 1.35T | — | 100만 컨텍스트, 엔터프라이즈 코딩 |
| 4 | DeepSeek-V3.2 | DeepSeek | 1.31T | — | 저가 롱테일 |
| 5 | Owl Alpha | OpenRouter | 1.15T | +29% | 무료 Agent 특화, 100만 컨텍스트 |
| 6 | Gemini 3 Flash Preview | 1.06T | — | 멀티모달, 학술/의료 | |
| 7 | DeepSeek-V4-Pro | DeepSeek | 1.00T | — | 매트릭스 플래그십(합계 5.74T) |
| 8 | MiniMax M2.7 | MiniMax | 806B | — | 장컨텍스트 가성비 |
| 9 | Grok 4.1 Fast | xAI | 721B | — | 200만 컨텍스트, 법무 |
| 10 | Step 3.5 Flash | StepFun | 673B | — | 고속 저가, 배치 |
토큰량만 보면 가격 차이의 상업 현실을 놓칩니다. Anthropic은 전형적인 프리미엄 역설을 보입니다: 토큰 점유 약 12%(1년 전 25%)인데 달러 매출 점유는 약 46%입니다. Claude Opus 4.6 월 매출 약 2,500만 달러인데 토큰량은 DeepSeek의 극히 일부입니다.
| 세그먼트 | 대표 모델 | 토큰 패턴 | 매출 패턴 |
|---|---|---|---|
| 고가치·저트래픽 | Claude Opus 시리즈 | 점유 하락 | 복잡 추론, 높은 ARPU |
| 가성비·중트래픽 | Google Gemini Flash | 안정 성장 | 멀티모달, 학술 |
| 초저가·고트래픽 | DeepSeek / MiniMax / StepFun | 점유 급확대 | Agent, 코딩, 배치 |
OpenRouter + a16z 《2025 AI 사용 보고》는 벤치마크 점수와 시장 점유가 종종 역상관함을 보여줍니다. 개발자는 극한 능력보다 추론 비용과 API 안정성을 중시합니다. DeepSeek·Hy3가 주간 1위인데 벤치마크 1위가 Top 10 밖인 현상과 일치합니다.
주간 순위는 매주 갱신됩니다. 라우팅도 주 단위로 반복해야 합니다. Claude Code, Cursor, OpenClaw, 자체 Gateway에 맞춘 Runbook입니다.
매주 월요일 Rankings 확인: openrouter.ai/rankings에서 글로벌 합계, 중미 점유, Top 10 변동을 기록하고 스크린샷을 팀과 공유합니다.
토큰 vs 달러 분리: Token share와 Revenue share를 함께 보고 무료 모델(Owl Alpha) 고트래픽을 프로덕션 기본값으로 오인하지 않습니다.
태스크별 모델 매핑: Agent/배치 → DeepSeek-V4-Flash; 엔터프라이즈 복잡 추론 → Claude Opus; 멀티모달 → Gemini Flash; 신규(Hy3, Owl Alpha)는 다음 돌파 신호로 모니터링.
고정 Prompt 세트 회귀: 매주 동일 Issue 부분집합으로 코딩을 실행하고 도구 호출 실패율을 주간 순위 변화와 대조합니다.
라우팅 JSON·예산 차단 갱신: Flash tier 동시성 완화, Opus tier 월간 상한; 폴백 Sonnet → V4-Flash → 수동 큐.
7×24 호스트로 라우트 검증: 라우팅은 임의 클라우드 가능; macOS 의존(Claude Code, OpenClaw) Agent는 Mac Mini M4 월세에 데몬을 두어 노트북 슬립 중단을 피합니다.
{
"weekly_review": "2026-05-24",
"routes": {
"agent_batch": "openrouter/deepseek/deepseek-v4-flash",
"enterprise": "openrouter/anthropic/claude-sonnet-4.6",
"complex_reasoning": "openrouter/anthropic/claude-opus-4.6",
"multimodal": "openrouter/google/gemini-3-flash-preview",
"experiment": "openrouter/owl-alpha"
},
"fallback": ["enterprise", "agent_batch"],
"monthly_cap_usd": 800
}
내부 memo·아키텍처 리뷰용 수치(OpenRouter 공개 데이터·동기 보도 교차 검증, 2026년 5월 18–24일 주):
OpenRouter는 추론 벤더 전환을 해결하지만 프로세스 감시, 키 경계, Apple 툴체인은 대체하지 못합니다. Flash tier에서 API 비용을 낮춰도 노트북 슬립으로 야간 Agent가 끊기거나 Linux VPS에서 Metal/Keychain/Xcode가 빠진 OpenClaw 운영에 시달리는 팀이 많습니다. OpenRouter 트렌드 선정 가이드, Mac Mini 대여로 OpenClaw 운영과 같이 모델은 토큰 과금으로 언제든 바꿀 수 있지만 호스트 uptime은 OpEx 계약입니다. 멀티 모델 라우팅을 인프라로 두고 iOS CI/CD·야간 Agent를 돌리는 팀에는 VpsMesh Mac Mini M4 클라우드 대여가 개인 MacBook보다 안정적입니다. 요금: Mac Mini M4 대여 가격, 구축: 고객 센터.
주간 토큰 호출량은 개발자의 실제 과금·프로덕션 트래픽을 반영하는 시장 온도계입니다. Benchmark는 극한 능력 비교에 적합하며 OpenRouter + a16z 보고는 점유와 역상관하는 경우가 많습니다. 주간 트렌드와 고정 태스크 private 회귀를 병행하고 openrouter.ai/rankings를 월간 확인하세요.
DeepSeek V4-Flash는 M tokens당 약 $0.10/$0.40로 Agent·배치 대량 호출에 적합합니다(해당 주 3.43T 1위). Claude는 30–50배 높은 단가, 토큰 점유는 낮지만 달러 점유 ~46%. OpenRouter 트렌드 선정 가이드 참고.
필수는 아닙니다. 순수 OpenRouter API는 Linux에서 가능합니다. Claude Code, Xcode, OpenClaw 데몬이 있으면 Mac Mini M4 월세가 편합니다. 1개월 대여로 주간 라우트·데몬을 검증: Mac Mini M4 대여 가격, 주문 페이지.