MCP Servers

llm-router-mcp

Enables Claude Code as a team leader to delegate tasks to GPT and Gemini experts, supporting multi-LLM collaboration with tools for consultation, code review, design, and background execution.

README

LLM Router MCP

Claude Code를 팀 리더로, GPT/Gemini를 전문가 팀으로 활용하는 MCP 서버

개요

LLM Router MCP는 Claude Code가 팀 리더 역할을 하며, GPT/Gemini 전문가에게 업무를 위임하는 MCP 서버입니다.

Note: Claude 모델은 MCP를 통해 호출되지 않습니다. Claude Code가 직접 Claude 역할을 수행하므로, 중첩 세션 문제를 피하면서 진정한 다중 LLM 협업이 가능합니다.

항목	수량
MCP 도구	109개
내장 훅	38개
AI 전문가	17개
내장 스킬	15개

주요 특징

멀티 LLM 협업: Claude Code(리더) + GPT/Gemini 전문가 협업
역할 분담: GPT(codex --full-auto)는 코드 변경 가능, Gemini(--yolo)는 리뷰/분석 전용
자동 폴백: Rate limit 발생 시 자동으로 다른 전문가로 전환
병렬 위임: delegate_task로 GPT 에이전트 1~3명에게 구현 작업 병렬 위임
중재형 토론: 중재자가 2라운드 패널 토론을 진행하고 최종 요약 반환
백그라운드 실행: 장시간 작업을 백그라운드에서 비동기 실행
HUD Statusline: 실시간 비용, 컨텍스트, 전문가 활동 모니터링

빠른 시작

AI로 다른 프로젝트에 적용시키기

다른 프로젝트에서 AI에게 아래처럼 요청하면 글로벌 CLI 설치와 Claude Code MCP 등록까지 진행하도록 유도할 수 있습니다.

예시 프롬프트:

LLM Router MCP를 npm 글로벌 설치 방식으로 설치하고 Claude Code에 등록해줘.
프로젝트 CLAUDE.md는 300줄 이내로 유지해야 하니, 공용 사용법 문서는 별도 참조 문서로 연결해줘.

AI가 수행해야 하는 적용 작업:

npm install -g llm-router-mcp 실행
custommcp install로 Claude Code MCP 설정 자동 등록
custommcp doctor로 Node.js, MCP 등록, codex, gemini CLI 상태 확인
대상 프로젝트의 CLAUDE.md에 공용 템플릿 구조 반영
프로젝트 CLAUDE.md에는 플러그인 사용 시 plugin/docs/USAGE.md를 읽으라고 적고, 프로젝트 고유 규칙만 유지
설치 후 llm_router_health 등으로 연결 확인

1. 설치

npm install -g llm-router-mcp
custommcp install
custommcp doctor

custommcp install은 ~/.claude/settings.json을 백업한 뒤 llm-router-mcp MCP 서버를 자동 등록합니다. 기존 llm-router-mcp 등록이 있으면 현재 설치 경로로 교체합니다. 전역 설치 단계에서는 레거시 CLIProxy 설정 스크립트를 자동 실행하지 않습니다. Claude Code 등록과 검증은 custommcp install과 custommcp doctor가 담당합니다.

2. CLI 도구 준비

터미널에서 사용할 LLM CLI 도구가 인증된 상태여야 합니다:

gemini — Google Gemini CLI (--yolo 모드로 자율 실행, 코드 변경 불가)
codex — OpenAI Codex CLI (--full-auto 모드로 자율 실행, 코드 변경 가능)

Note: claude CLI는 필요하지 않습니다. Claude Code가 직접 Claude 역할을 수행합니다.

3. 환경변수 설정 (선택)

EXA_API_KEY=your_exa_api_key        # 선택: 웹 검색
CONTEXT7_API_KEY=your_key           # 선택: 라이브러리 문서
CLI_GEMINI_PATH=gemini              # 선택: PATH에 없을 때만 지정
CLI_CODEX_PATH=codex                # 선택: PATH에 없을 때만 지정

4. Claude Code 연동

custommcp install이 Claude Code 설정을 자동으로 등록합니다. 프로젝트별 사용 규칙을 빠르게 붙이고 싶으면 공용 템플릿 plugin/templates/CLAUDE.md를 프로젝트 루트 CLAUDE.md의 시작점으로 사용하고, 플러그인 상세 운영 규칙은 plugin/docs/USAGE.md를 참조하면 됩니다.

5. 로컬 개발 폴더명

저장소와 npm 패키지 이름은 llm-router-mcp입니다. 로컬 개발 폴더도 llm-router-mcp/를 권장합니다. CLI 명령어 custommcp는 기존 사용자 호환성을 위해 유지합니다.

역할 분담

CLI 도구	모드	코드 변경	용도	자동 로드
`codex` (GPT)	`--full-auto`	가능	`delegate_task` 전용 구현 작업	`AGENTS.md`
`gemini` (Gemini)	`--yolo`	불가	리뷰/분석 전용	`GEMINI.md`

두 CLI 도구 모두 파일 경로를 넘기면 직접 읽음 (토큰 절약)
2명 이상 전문가 호출 시 반드시 병렬 (consult_experts_parallel)

전문가 시스템

GPT/Gemini 전문가만 MCP를 통해 호출됩니다. Claude 관련 분석/판단은 Claude Code가 직접 수행합니다.

기본 전문가 (5명)

전문가	모델	역할	폴백
`strategist`	GPT	아키텍처 설계, 디버깅 전략	codereview → momus
`codereview`	Gemini Pro + GPT	통합 코드 리뷰 (perspectives로 GPT+Gemini 병렬 리뷰)	strategist → momus
`frontend`	Gemini Pro	UI/UX, 컴포넌트 설계	strategist → momus
`metis`	GPT	전략적 계획, 문제 분해	strategist → codereview
`momus`	Gemini Pro	비판적 분석, 품질 평가	codereview → strategist

특화 전문가 (7명)

전문가	모델	역할	폴백
`security`	GPT	OWASP/CWE 보안 분석	codereview → strategist
`tester`	GPT	TDD/테스트 전략	codereview → strategist
`data`	GPT	DB 설계, 쿼리 최적화	strategist → codereview
`devops`	GPT	CI/CD, Docker, K8s	strategist → codereview
`reality_checker`	Gemini Pro	현실 검증, dead code 탐지	momus → codereview
`lsp_index_engineer`	GPT	심볼/참조 분석	codereview → strategist
`codereview_gpt`	GPT	GPT 코드리뷰 - SOLID/설계/실무 관점 (READ-ONLY)	codereview → momus

동적 페르소나 전문가 (4명)

토론 시 AI가 자동으로 역할을 부여하는 빈 슬롯 (GPT/Gemini only):

전문가	모델
`gpt_blank_1`	GPT
`gpt_blank_2`	GPT
`gemini_blank_1`	Gemini Pro
`gemini_blank_2`	Gemini Flash

토론 중재자 (1명)

전문가	모델	역할
`debate_moderator`	Gemini Pro	패널 토론 중재 및 최종 요약

핵심 도구

전문가 상담

도구	설명
`consult_expert`	전문가에게 직접 질문
`consult_experts_parallel`	2명 이상 전문가 병렬 상담
`route_by_category`	카테고리 기반 자동 라우팅
`ensemble_query`	여러 전문가 의견 종합
`moderated_debate`	중재자가 2라운드 패널 토론 진행

작업 위임

도구	설명
`delegate_task`	GPT 에이전트 1~3명에게 구현 작업 병렬 위임 (plan → execute → report)
`review_code`	멀티 관점 코드 리뷰 (files 경로 기반, context_docs, 1~3 perspectives 병렬)

백그라운드 실행

도구	설명
`background_expert_start`	비동기 전문가 실행 시작
`background_expert_result`	작업 결과 확인
`background_expert_cancel`	실행 중인 작업 취소
`background_expert_list`	전체 백그라운드 작업 목록

워크플로우

도구	설명
`design_with_experts`	다중 전문가 설계 워크플로우
`research_topic`	주제 연구 (quick/normal/deep)

코드 분석

도구	설명
`lsp_get_definition`	심볼 정의 위치
`lsp_get_references`	심볼 참조 찾기
`lsp_get_hover`	타입/문서 정보
`ast_grep_search`	AST 패턴 검색
`ast_grep_replace`	AST 패턴 치환

Git

도구	설명
`git_atomic_commit`	자동 그룹화 커밋
`git_history_search`	커밋 히스토리 검색
`git_rebase_planner`	리베이스 계획
`git_branch_analysis`	브랜치 분석

기타

도구	설명
`web_search`	Exa 웹 검색
`get_library_docs`	라이브러리 문서 조회
`playwright_screenshot`	웹 페이지 캡처
`session_search`	세션 히스토리 검색

훅 시스템

38개 내장 훅으로 동작 확장:

핵심 훅

훅	설명
`sisyphus-orchestrator`	작업 완료 강제 오케스트레이션
`todo-continuation-enforcer`	TODO 완료 강제
`think-mode`	확장 사고 모드
`rules-injector`	`.claude/rules/` 규칙 자동 주입
`magic-keywords`	매직 키워드 감지

안정성 훅

훅	설명
`session-recovery`	세션 에러 자동 복구
`edit-error-recovery`	편집 에러 복구
`preemptive-compaction`	선제적 컨텍스트 압축
`context-window-monitor`	컨텍스트 사용량 모니터링
`doom-loop-detector`	반복 패턴 감지
`rate-limit-handler`	Rate limit 자동 처리

UX 훅

훅	설명
`auto-update-checker`	버전 업데이트 알림
`task-toast-manager`	작업 완료 알림
`hud-state-updater`	HUD 상태 업데이트
`directory-injector`	AGENTS.md/GEMINI.md 자동 로드

스킬 시스템

15개 내장 스킬이 자연어 요청을 인식하여 자동으로 호출됩니다:

스킬	설명	호출 방식
`llm-plan`	Claude 설계 후 Agent 자체 검토 + GPT 설계 검토를 거쳐 GPT 전체 구현 위임	자동
`llm-planAll`	Claude와 GPT가 설계 검토를 거친 뒤 역할을 나눠 동시 작업	자동
`llm-codereview`	9단계 코드 리뷰 파이프라인	자동
`llm-validate`	코드 검증 (빌드/타입/참조)	자동
`llm-security`	OWASP 보안 감사	자동
`llm-research`	기술 리서치	자동
`llm-design`	설계 워크플로우	자동 (확인 후)
`llm-tdd`	TDD 워크플로우	자동 (확인 후)
`llm-background`	백그라운드 작업	자동 (확인 후)
`llm-debate`	중재형 토론	자동 (확인 후)
`llm-consult`	전문가 상담	자동
`llm-verify`	교차 검증	자동
`llm-analyze`	깊은 분석	자동
`llm-health`	헬스체크	자동
`llm-guide`	시스템 가이드	자동 참조

중재형 토론

중재자가 안건을 모든 참여자에게 병렬로 던지고, 1차 응답을 종합한 뒤 다시 한 번 병렬 재질의합니다.

moderated_debate({
  agenda: "마이크로서비스 vs 모놀리식",
  participant_count: 3,
  repeat_count: 1
})

직접 페르소나를 주고 싶으면 participants를 넘기고, 아니면 participant_count(2-4)만 넘겨 자동 페르소나 배정을 사용합니다.

설계 위임 스킬

llm-plan과 llm-planAll은 바로 구현에 들어가지 않고, 설계 검토 게이트를 먼저 통과합니다.

`llm-plan`

흐름:

Claude가 plan 모드에서 설계와 GPT 서브태스크를 작성
Claude가 Agent 도구로 설계 검토를 수행
GPT 설계 전문가가 2차 검토
두 검토를 통과하면 사용자 확인 후 GPT 에이전트 1~3명에게 구현 위임
구현 결과를 멀티 관점으로 리뷰

특징:

Claude는 설계와 리뷰만 수행
실제 코드 변경은 GPT만 수행
설계 검토 중 이슈가 나오면 plan으로 돌아가 수정 후 재검토

`llm-planAll`

흐름:

Claude가 plan 모드에서 자신의 작업과 GPT 작업을 분리해 설계
Claude가 Agent 도구로 설계 검토를 수행
GPT 설계 전문가가 2차 검토
두 검토를 통과하면 사용자 확인
GPT 작업을 먼저 백그라운드 위임하고, Claude도 자기 파일 범위에서 동시 구현
전체 결과를 통합 리뷰

특징:

Claude와 GPT가 같은 파일을 수정하면 안 됨
Claude 작업과 GPT 작업은 독립적이어야 함
설계 검토 전에는 위임이나 구현을 시작하지 않음

Think Mode

복잡한 문제에 대한 깊은 분석:

키워드	레벨	토큰 예산
`think`, `생각`	normal	10,000
`think hard`, `깊이 생각`	deep	20,000
`ultrathink`	extreme	50,000

모델별 타임아웃

모델	타임아웃	이유
GPT 5.x / Codex	20분	`--full-auto` 자율 실행
Gemini Pro	10분	`--yolo` 자율 실행
Gemini Flash	5분	`--yolo` 자율 실행
기타	1분	기본값

프로젝트 구조

llm-router-mcp/
├── src/
│   ├── index.ts              # MCP 서버 진입점
│   ├── experts/              # 전문가 정의 (11개 + 토론 전용 슬롯)
│   ├── tools/                # MCP 도구 (109개)
│   ├── hooks/builtin/        # 내장 훅 (38개)
│   ├── hud/                  # HUD 상태 관리
│   ├── features/             # 기능 모듈
│   │   ├── skill-system/     # 스킬 시스템
│   │   ├── mcp-loader/       # MCP 서버 관리
│   │   └── boulder-state/    # 볼더 상태 관리
│   ├── services/             # 핵심 서비스
│   │   ├── expert-router.ts  # 전문가 라우팅
│   │   ├── cliproxy-client.ts # CLI 도구 오케스트레이터
│   │   ├── providers/         # CLI 프로바이더 (Gemini/Codex only)
│   │   └── background-manager.ts # 백그라운드 작업 관리
│   └── utils/                # 유틸리티
├── plugin/skills/            # 내장 스킬 (15개)
└── dist/                     # 빌드 출력

CLI 도구 연동

터미널에 설치된 CLI 도구를 child_process.spawn()으로 직접 호출합니다.

지원 CLI 도구

gemini — Gemini Pro/Flash 모델 (--yolo 모드, 리뷰/분석 전용)
codex — GPT 계열 모델 (--full-auto 모드, 코드 변경 가능)

Note: claude CLI는 사용하지 않습니다. Claude Code가 직접 Claude 역할을 수행합니다.

사전 요구사항

각 CLI 도구가 터미널에서 인증 완료된 상태여야 합니다. CLI 도구 경로는 .env에서 설정 가능합니다 (PATH에 있으면 생략 가능):

CLI_GEMINI_PATH=gemini
CLI_CODEX_PATH=codex

문제 해결

CLI 도구 연결 실패

# CLI 도구 설치 확인
gemini --version
codex --version

# 인증 상태 확인
gemini auth status
codex auth status

Rate Limit

시스템이 자동으로:

HTTP 429 및 에러 메시지 패턴 감지
모델을 제한 상태로 표시
폴백 전문가로 라우팅
지수 백오프로 재시도

영감을 받은 프로젝트

라이선스

MIT

Recommended Servers

playwright-mcp

A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.

Official

Featured

TypeScript

Magic Component Platform (MCP)

An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.

Audiense Insights MCP Server

Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.

VeyraX MCP

Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.

Official

Featured

Local

graphlit-mcp-server

The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.

Official

Featured

TypeScript

Kagi MCP Server

An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.

Official

Featured

Python

E2B

Using MCP to run code via e2b.

Official

Featured

Neon Database

MCP server for interacting with Neon Management API and databases

Official

Featured

Exa Search

A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.

Official

Featured

Qdrant Server

This repository is an example of how to create a MCP server for Qdrant, a vector search engine.

Official

Featured