agent-vrm-mcp
Enables Claude to generate speech from text and express it through a 3D VRM avatar via the AgentVRM engine.
README
<div align="center">
🤖 Agent VRM MCP サーバー
</div>
<div align="center">
</div>
AgentVRM を介してVRMアバター機能を提供する Model Context Protocol サーバーです。このサーバーにより、Claude は AgentVRM エンジンが提供するVRMアバターを使用してテキストから音声を生成し、3Dアバターとして表現することができます。
🎥 デモ動画
https://github.com/user-attachments/assets/ea4b736d-a326-45b0-be88-b01fff6dc3f3
✨ 機能
- テキスト読み上げ: 指定したテキストを AgentVRM のVRMアバターで読み上げます。
- VRMアバター表示: 3DのVRMアバターがテキストを読み上げ、表情やアニメーションも表現します。
- 音声の自動再生: 生成した音声をその場で自動的に再生します。
- 音声ファイル保存: 生成した音声は
assetsフォルダに.wavファイルとして保存されます。
🚀 前提条件
- AgentVRM エンジンが動作していること(ローカルまたはリモートで)
- Python 3.10 以上
📦 インストール
uv の使用(推奨)
uv を使用する場合は特別なインストールは必要ありません。直接 uvx を使用して agent-vrm-mcp を実行します。
⚙️ 設定
AgentVRM エンジン
このサーバーは動作するために AgentVRM エンジンが必要です。エンジンの起動は手動で行う必要があります。
デフォルトでは http://localhost:3001/api/speak_text への接続を試みます。--api-url 引数で別の URL を指定することができます。
AgentVRM エンジンは 公式 AgentVRM リポジトリ からダウンロードしてインストールできます。
Claude Desktop 用の設定
Claude Desktop の設定に追加:
<details> <summary>uvx を使用する場合</summary>
{
"mcpServers": {
"vrm": {
"command": "uvx",
"args": ["agent-vrm-mcp", "--api-url=http://localhost:3001/api/speak_text"]
}
}
}
</details>
🛠️ 利用可能なツール
speak_text- AgentVRM を使用してテキストを音声に変換し、VRMアバターで表現- 必須引数:
text(文字列): 音声に変換するテキスト
- オプション引数:
speaker_id(整数、デフォルト: 1): 使用する話者の IDspeed_scale(数値、デフォルト: 1.0): 再生速度の倍率auto_play(真偽値、デフォルト: True): 生成後に自動再生するか
- 必須引数:
🎵 特別な機能
- 生成後の音声は、プラットフォーム固有の方法で自動的に再生されます:
- Windows: デフォルトのシステムプレーヤーを使用
- macOS: 内蔵の
afplayユーティリティを使用 - Linux: まず
aplayを試し、失敗した場合はxdg-openにフォールバック
📁 プロジェクト構造
🧑💻 開発モードでのセットアップ・実行手順
開発者向けに、uv を用いた開発モードでのインストールおよびMCP Inspectorによる実行手順をまとめます。
# プロジェクトディレクトリで開発モードでインストール
cd C:\Prj\agent-vrm-mcp
uv sync
# 開発モードでパッケージをインストール
uv pip install -e .
# MCP Inspector で実行
npx @modelcontextprotocol/inspector python -m agent_vrm_mcp --api-url=http://localhost:3001/api/speak_text
uv syncで依存パッケージを同期します。uv pip install -e .で開発モード(編集可能インストール)を行います。- MCP Inspectorを使うことで、
agent_vrm_mcpサーバーをAPIエンドポイント指定で起動できます。
📄 ライセンス
agent-vrm-mcp は MIT ライセンスの下で提供されています。これは、MIT ライセンスの条件に従い、自由に使用、修正、配布することができることを意味します。
🔗 リンク
Recommended Servers
playwright-mcp
A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.
Magic Component Platform (MCP)
An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.
Audiense Insights MCP Server
Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.
VeyraX MCP
Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.
graphlit-mcp-server
The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.
Kagi MCP Server
An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.
E2B
Using MCP to run code via e2b.
Neon Database
MCP server for interacting with Neon Management API and databases
Qdrant Server
This repository is an example of how to create a MCP server for Qdrant, a vector search engine.
Exa Search
A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.