llm-router-mcp

llm-router-mcp

Enables Claude Code as a team leader to delegate tasks to GPT and Gemini experts, supporting multi-LLM collaboration with tools for consultation, code review, design, and background execution.

Category
Visit Server

README

LLM Router MCP

Claude Code를 팀 리더로, GPT/Gemini를 전문가 팀으로 활용하는 MCP 서버

Node.js TypeScript MCP

개요

LLM Router MCP는 Claude Code가 팀 리더 역할을 하며, GPT/Gemini 전문가에게 업무를 위임하는 MCP 서버입니다.

Note: Claude 모델은 MCP를 통해 호출되지 않습니다. Claude Code가 직접 Claude 역할을 수행하므로, 중첩 세션 문제를 피하면서 진정한 다중 LLM 협업이 가능합니다.

항목 수량
MCP 도구 109개
내장 훅 38개
AI 전문가 17개
내장 스킬 15개

주요 특징

  • 멀티 LLM 협업: Claude Code(리더) + GPT/Gemini 전문가 협업
  • 역할 분담: GPT(codex --full-auto)는 코드 변경 가능, Gemini(--yolo)는 리뷰/분석 전용
  • 자동 폴백: Rate limit 발생 시 자동으로 다른 전문가로 전환
  • 병렬 위임: delegate_task로 GPT 에이전트 1~3명에게 구현 작업 병렬 위임
  • 중재형 토론: 중재자가 2라운드 패널 토론을 진행하고 최종 요약 반환
  • 백그라운드 실행: 장시간 작업을 백그라운드에서 비동기 실행
  • HUD Statusline: 실시간 비용, 컨텍스트, 전문가 활동 모니터링

빠른 시작

AI로 다른 프로젝트에 적용시키기

다른 프로젝트에서 AI에게 아래처럼 요청하면 글로벌 CLI 설치와 Claude Code MCP 등록까지 진행하도록 유도할 수 있습니다.

예시 프롬프트:

LLM Router MCP를 npm 글로벌 설치 방식으로 설치하고 Claude Code에 등록해줘.
프로젝트 CLAUDE.md는 300줄 이내로 유지해야 하니, 공용 사용법 문서는 별도 참조 문서로 연결해줘.

AI가 수행해야 하는 적용 작업:

  1. npm install -g llm-router-mcp 실행
  2. custommcp install로 Claude Code MCP 설정 자동 등록
  3. custommcp doctor로 Node.js, MCP 등록, codex, gemini CLI 상태 확인
  4. 대상 프로젝트의 CLAUDE.md에 공용 템플릿 구조 반영
  5. 프로젝트 CLAUDE.md에는 플러그인 사용 시 plugin/docs/USAGE.md를 읽으라고 적고, 프로젝트 고유 규칙만 유지
  6. 설치 후 llm_router_health 등으로 연결 확인

1. 설치

npm install -g llm-router-mcp
custommcp install
custommcp doctor

custommcp install~/.claude/settings.json을 백업한 뒤 llm-router-mcp MCP 서버를 자동 등록합니다. 기존 llm-router-mcp 등록이 있으면 현재 설치 경로로 교체합니다. 전역 설치 단계에서는 레거시 CLIProxy 설정 스크립트를 자동 실행하지 않습니다. Claude Code 등록과 검증은 custommcp installcustommcp doctor가 담당합니다.

2. CLI 도구 준비

터미널에서 사용할 LLM CLI 도구가 인증된 상태여야 합니다:

  • gemini — Google Gemini CLI (--yolo 모드로 자율 실행, 코드 변경 불가)
  • codex — OpenAI Codex CLI (--full-auto 모드로 자율 실행, 코드 변경 가능)

Note: claude CLI는 필요하지 않습니다. Claude Code가 직접 Claude 역할을 수행합니다.

3. 환경변수 설정 (선택)

EXA_API_KEY=your_exa_api_key        # 선택: 웹 검색
CONTEXT7_API_KEY=your_key           # 선택: 라이브러리 문서
CLI_GEMINI_PATH=gemini              # 선택: PATH에 없을 때만 지정
CLI_CODEX_PATH=codex                # 선택: PATH에 없을 때만 지정

4. Claude Code 연동

custommcp install이 Claude Code 설정을 자동으로 등록합니다. 프로젝트별 사용 규칙을 빠르게 붙이고 싶으면 공용 템플릿 plugin/templates/CLAUDE.md를 프로젝트 루트 CLAUDE.md의 시작점으로 사용하고, 플러그인 상세 운영 규칙은 plugin/docs/USAGE.md를 참조하면 됩니다.

5. 로컬 개발 폴더명

저장소와 npm 패키지 이름은 llm-router-mcp입니다. 로컬 개발 폴더도 llm-router-mcp/를 권장합니다. CLI 명령어 custommcp는 기존 사용자 호환성을 위해 유지합니다.


역할 분담

CLI 도구 모드 코드 변경 용도 자동 로드
codex (GPT) --full-auto 가능 delegate_task 전용 구현 작업 AGENTS.md
gemini (Gemini) --yolo 불가 리뷰/분석 전용 GEMINI.md
  • 두 CLI 도구 모두 파일 경로를 넘기면 직접 읽음 (토큰 절약)
  • 2명 이상 전문가 호출 시 반드시 병렬 (consult_experts_parallel)

전문가 시스템

GPT/Gemini 전문가만 MCP를 통해 호출됩니다. Claude 관련 분석/판단은 Claude Code가 직접 수행합니다.

기본 전문가 (5명)

전문가 모델 역할 폴백
strategist GPT 아키텍처 설계, 디버깅 전략 codereview → momus
codereview Gemini Pro + GPT 통합 코드 리뷰 (perspectives로 GPT+Gemini 병렬 리뷰) strategist → momus
frontend Gemini Pro UI/UX, 컴포넌트 설계 strategist → momus
metis GPT 전략적 계획, 문제 분해 strategist → codereview
momus Gemini Pro 비판적 분석, 품질 평가 codereview → strategist

특화 전문가 (7명)

전문가 모델 역할 폴백
security GPT OWASP/CWE 보안 분석 codereview → strategist
tester GPT TDD/테스트 전략 codereview → strategist
data GPT DB 설계, 쿼리 최적화 strategist → codereview
devops GPT CI/CD, Docker, K8s strategist → codereview
reality_checker Gemini Pro 현실 검증, dead code 탐지 momus → codereview
lsp_index_engineer GPT 심볼/참조 분석 codereview → strategist
codereview_gpt GPT GPT 코드리뷰 - SOLID/설계/실무 관점 (READ-ONLY) codereview → momus

동적 페르소나 전문가 (4명)

토론 시 AI가 자동으로 역할을 부여하는 빈 슬롯 (GPT/Gemini only):

전문가 모델
gpt_blank_1 GPT
gpt_blank_2 GPT
gemini_blank_1 Gemini Pro
gemini_blank_2 Gemini Flash

토론 중재자 (1명)

전문가 모델 역할
debate_moderator Gemini Pro 패널 토론 중재 및 최종 요약

핵심 도구

전문가 상담

도구 설명
consult_expert 전문가에게 직접 질문
consult_experts_parallel 2명 이상 전문가 병렬 상담
route_by_category 카테고리 기반 자동 라우팅
ensemble_query 여러 전문가 의견 종합
moderated_debate 중재자가 2라운드 패널 토론 진행

작업 위임

도구 설명
delegate_task GPT 에이전트 1~3명에게 구현 작업 병렬 위임 (plan → execute → report)
review_code 멀티 관점 코드 리뷰 (files 경로 기반, context_docs, 1~3 perspectives 병렬)

백그라운드 실행

도구 설명
background_expert_start 비동기 전문가 실행 시작
background_expert_result 작업 결과 확인
background_expert_cancel 실행 중인 작업 취소
background_expert_list 전체 백그라운드 작업 목록

워크플로우

도구 설명
design_with_experts 다중 전문가 설계 워크플로우
research_topic 주제 연구 (quick/normal/deep)

코드 분석

도구 설명
lsp_get_definition 심볼 정의 위치
lsp_get_references 심볼 참조 찾기
lsp_get_hover 타입/문서 정보
ast_grep_search AST 패턴 검색
ast_grep_replace AST 패턴 치환

Git

도구 설명
git_atomic_commit 자동 그룹화 커밋
git_history_search 커밋 히스토리 검색
git_rebase_planner 리베이스 계획
git_branch_analysis 브랜치 분석

기타

도구 설명
web_search Exa 웹 검색
get_library_docs 라이브러리 문서 조회
playwright_screenshot 웹 페이지 캡처
session_search 세션 히스토리 검색

훅 시스템

38개 내장 훅으로 동작 확장:

핵심 훅

설명
sisyphus-orchestrator 작업 완료 강제 오케스트레이션
todo-continuation-enforcer TODO 완료 강제
think-mode 확장 사고 모드
rules-injector .claude/rules/ 규칙 자동 주입
magic-keywords 매직 키워드 감지

안정성 훅

설명
session-recovery 세션 에러 자동 복구
edit-error-recovery 편집 에러 복구
preemptive-compaction 선제적 컨텍스트 압축
context-window-monitor 컨텍스트 사용량 모니터링
doom-loop-detector 반복 패턴 감지
rate-limit-handler Rate limit 자동 처리

UX 훅

설명
auto-update-checker 버전 업데이트 알림
task-toast-manager 작업 완료 알림
hud-state-updater HUD 상태 업데이트
directory-injector AGENTS.md/GEMINI.md 자동 로드

스킬 시스템

15개 내장 스킬이 자연어 요청을 인식하여 자동으로 호출됩니다:

스킬 설명 호출 방식
llm-plan Claude 설계 후 Agent 자체 검토 + GPT 설계 검토를 거쳐 GPT 전체 구현 위임 자동
llm-planAll Claude와 GPT가 설계 검토를 거친 뒤 역할을 나눠 동시 작업 자동
llm-codereview 9단계 코드 리뷰 파이프라인 자동
llm-validate 코드 검증 (빌드/타입/참조) 자동
llm-security OWASP 보안 감사 자동
llm-research 기술 리서치 자동
llm-design 설계 워크플로우 자동 (확인 후)
llm-tdd TDD 워크플로우 자동 (확인 후)
llm-background 백그라운드 작업 자동 (확인 후)
llm-debate 중재형 토론 자동 (확인 후)
llm-consult 전문가 상담 자동
llm-verify 교차 검증 자동
llm-analyze 깊은 분석 자동
llm-health 헬스체크 자동
llm-guide 시스템 가이드 자동 참조

중재형 토론

중재자가 안건을 모든 참여자에게 병렬로 던지고, 1차 응답을 종합한 뒤 다시 한 번 병렬 재질의합니다.

moderated_debate({
  agenda: "마이크로서비스 vs 모놀리식",
  participant_count: 3,
  repeat_count: 1
})

직접 페르소나를 주고 싶으면 participants를 넘기고, 아니면 participant_count(2-4)만 넘겨 자동 페르소나 배정을 사용합니다.


설계 위임 스킬

llm-planllm-planAll은 바로 구현에 들어가지 않고, 설계 검토 게이트를 먼저 통과합니다.

llm-plan

흐름:

  1. Claude가 plan 모드에서 설계와 GPT 서브태스크를 작성
  2. Claude가 Agent 도구로 설계 검토를 수행
  3. GPT 설계 전문가가 2차 검토
  4. 두 검토를 통과하면 사용자 확인 후 GPT 에이전트 1~3명에게 구현 위임
  5. 구현 결과를 멀티 관점으로 리뷰

특징:

  • Claude는 설계와 리뷰만 수행
  • 실제 코드 변경은 GPT만 수행
  • 설계 검토 중 이슈가 나오면 plan으로 돌아가 수정 후 재검토

llm-planAll

흐름:

  1. Claude가 plan 모드에서 자신의 작업과 GPT 작업을 분리해 설계
  2. Claude가 Agent 도구로 설계 검토를 수행
  3. GPT 설계 전문가가 2차 검토
  4. 두 검토를 통과하면 사용자 확인
  5. GPT 작업을 먼저 백그라운드 위임하고, Claude도 자기 파일 범위에서 동시 구현
  6. 전체 결과를 통합 리뷰

특징:

  • Claude와 GPT가 같은 파일을 수정하면 안 됨
  • Claude 작업과 GPT 작업은 독립적이어야 함
  • 설계 검토 전에는 위임이나 구현을 시작하지 않음

Think Mode

복잡한 문제에 대한 깊은 분석:

키워드 레벨 토큰 예산
think, 생각 normal 10,000
think hard, 깊이 생각 deep 20,000
ultrathink extreme 50,000

모델별 타임아웃

모델 타임아웃 이유
GPT 5.x / Codex 20분 --full-auto 자율 실행
Gemini Pro 10분 --yolo 자율 실행
Gemini Flash 5분 --yolo 자율 실행
기타 1분 기본값

프로젝트 구조

llm-router-mcp/
├── src/
│   ├── index.ts              # MCP 서버 진입점
│   ├── experts/              # 전문가 정의 (11개 + 토론 전용 슬롯)
│   ├── tools/                # MCP 도구 (109개)
│   ├── hooks/builtin/        # 내장 훅 (38개)
│   ├── hud/                  # HUD 상태 관리
│   ├── features/             # 기능 모듈
│   │   ├── skill-system/     # 스킬 시스템
│   │   ├── mcp-loader/       # MCP 서버 관리
│   │   └── boulder-state/    # 볼더 상태 관리
│   ├── services/             # 핵심 서비스
│   │   ├── expert-router.ts  # 전문가 라우팅
│   │   ├── cliproxy-client.ts # CLI 도구 오케스트레이터
│   │   ├── providers/         # CLI 프로바이더 (Gemini/Codex only)
│   │   └── background-manager.ts # 백그라운드 작업 관리
│   └── utils/                # 유틸리티
├── plugin/skills/            # 내장 스킬 (15개)
└── dist/                     # 빌드 출력

CLI 도구 연동

터미널에 설치된 CLI 도구를 child_process.spawn()으로 직접 호출합니다.

지원 CLI 도구

  • gemini — Gemini Pro/Flash 모델 (--yolo 모드, 리뷰/분석 전용)
  • codex — GPT 계열 모델 (--full-auto 모드, 코드 변경 가능)

Note: claude CLI는 사용하지 않습니다. Claude Code가 직접 Claude 역할을 수행합니다.

사전 요구사항

각 CLI 도구가 터미널에서 인증 완료된 상태여야 합니다. CLI 도구 경로는 .env에서 설정 가능합니다 (PATH에 있으면 생략 가능):

CLI_GEMINI_PATH=gemini
CLI_CODEX_PATH=codex

문제 해결

CLI 도구 연결 실패

# CLI 도구 설치 확인
gemini --version
codex --version

# 인증 상태 확인
gemini auth status
codex auth status

Rate Limit

시스템이 자동으로:

  1. HTTP 429 및 에러 메시지 패턴 감지
  2. 모델을 제한 상태로 표시
  3. 폴백 전문가로 라우팅
  4. 지수 백오프로 재시도

영감을 받은 프로젝트


라이선스

MIT

Recommended Servers

playwright-mcp

playwright-mcp

A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.

Official
Featured
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.

Official
Featured
Local
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.

Official
Featured
Local
TypeScript
VeyraX MCP

VeyraX MCP

Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.

Official
Featured
Local
graphlit-mcp-server

graphlit-mcp-server

The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.

Official
Featured
TypeScript
Kagi MCP Server

Kagi MCP Server

An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.

Official
Featured
Python
E2B

E2B

Using MCP to run code via e2b.

Official
Featured
Neon Database

Neon Database

MCP server for interacting with Neon Management API and databases

Official
Featured
Exa Search

Exa Search

A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.

Official
Featured
Qdrant Server

Qdrant Server

This repository is an example of how to create a MCP server for Qdrant, a vector search engine.

Official
Featured