YouTube Transcript MCP Server
Fetches YouTube video transcripts with timestamps and provides them to LLM agents via MCP, enabling natural language access to video content.
README
YouTube Transcript MCP Tool
Ferramenta MCP para obter transcrições de vídeos do YouTube com timestamps e fornecer para agentes LLM.
Índice
- Instalação / Uso via npx
- Instalação como biblioteca
- Compatível com OpenAI SDK (Chat Completions Tools)
- Configuração como MCP Server
- Deploy no Deno Deploy (MCP Remoto)
- Formato de entrada e saída
- Regras de Seleção de Legenda
- Comportamento de Erro
- Limitações
- Desenvolvimento
- Testes Esperados
Instalação / Uso via npx
Via GitHub:
npx -y --package=github:lucasliet/youtube-transcript-mcp#main youtube-transcript-mcp --videoUrl "https://www.youtube.com/watch?v=VIDEO_ID" --preferredLanguages "pt-BR,en"
Saída do CLI: JSON no stdout (array de segmentos) ou null em falha.
Instalação como biblioteca (npm via GitHub)
Como o pacote não está publicado no npm, instale diretamente do GitHub:
npm i github:lucasliet/youtube-transcript-mcp#main
Import ESM:
import tools from 'youtube-transcript-mcp'
tools é um array onde cada item é uma tupla [name, { schema, fn }]. O schema está pronto para ser passado ao tools da API do OpenAI, e fn(args) executa a ferramenta e retorna os segmentos.
Compatível com OpenAI SDK (Chat Completions Tools)
Esta biblioteca já expõe a ferramenta no formato de schema esperado pelo OpenAI SDK para a API de Chat Completions (tools do tipo function). Você pode reaproveitar o schema diretamente e despachar a execução pelo fn exportado.
Exemplo de uso com openai (Node ESM):
import OpenAI from 'openai'
import ytTools from 'youtube-transcript-mcp'
const openai = new OpenAI({ apiKey: process.env.OPENAI_API_KEY })
// Extrai os schemas de tools no formato esperado pela API do OpenAI
const openaiTools = ytTools.map(([, t]) => t.schema)
const messages = [
{ role: 'user', content: 'Get transcript for https://www.youtube.com/watch?v=dQw4w9WgXcQ' }
]
const res = await openai.chat.completions.create({
model: 'gpt-4o-mini',
messages,
tools: openaiTools
})
// Se o modelo pediu chamada de ferramenta, resolva e mantenha o histórico
if (res.choices?.[0]?.message?.tool_calls) {
messages.push({
role: 'assistant',
content: res.choices[0].message.content || '',
tool_calls: res.choices[0].message.tool_calls
})
for (const tool_call of res.choices[0].message.tool_calls) {
const fnName = tool_call.function?.name
const args = JSON.parse(tool_call.function?.arguments || '{}')
const entry = ytTools.find(([n]) => n === fnName)
if (!entry) continue
const fn = entry[1].fn
const result = await fn(args)
messages.push({
role: 'tool',
tool_call_id: tool_call.id,
content: JSON.stringify(result)
})
}
// Opcional: Faça uma chamada de follow-up com o histórico atualizado
const followUpRes = await openai.chat.completions.create({
model: 'gpt-4o-mini',
messages
})
console.log(followUpRes.choices[0].message.content)
}
Configuração como MCP Server
Coloque no arquivo de configuração do host MCP:
{
"mcpServers": {
"youtube-transcript": {
"command": "npx",
"args": ["-y", "--package=github:lucasliet/youtube-transcript-mcp#main", "youtube-transcript-mcp"],
"env": {}
}
}
}
Este servidor utiliza @modelcontextprotocol/sdk e comunica via stdio.
Formato de retorno (MCP):
- O handler
tools/callretornacontentcomtype: "text"contendo o JSON serializado do array de segmentos.
Executando como servidor remoto (SSE)
Para iniciar o servidor remoto (Node.js ou Deno 2 localmente), use:
npm run start:remote --host 0.0.0.0 --port 3000 --cors "*" # Node.js
# ou com Deno 2 (também funciona, pois node:http é compatível):
deno run --allow-net --allow-env --allow-read src/cli.js --mode remote --port 3000 --cors "*"
Nota: O Deno 2 é compatível com
node:httpe consegue rodar ostart:remotenormalmente em ambiente local. O entrypointsrc/deno-deploy.jssó é necessário para o Deno Deploy (serverless/isolates), onde não existe processo persistente enode:http .listen()não funciona — apenasDeno.serve()é suportado.
Endpoints expostos:
GET /mcp: abre o stream SSE, envia eventoendpointcomsessionIde heartbeats.POST /mcp?sessionId=<id>: recebe frames JSON-RPC (initialize,tools/list,tools/call,shutdown) identificados pelo query param ou cabeçalhoMcp-Session-Id.
Recursos chave:
- Handshake MCP (
initialize/shutdown) tratado automaticamente pelo SDK. Mcp-Session-Idexposto via header para transporte HTTP e SSE.- Compatibilidade legada:
/mcp/eventse/mcp/messagesretornam mensagens de migração. - Conexões liveness: heartbeats periódicos e limpeza de sessões expiradas.
Flags úteis:
--host: Host/IP para bind do servidor (padrão:0.0.0.0)--port: Porta do servidor (padrão:3000)--cors: Configuração CORS (false,*ou origem específica)--heartbeat-interval: Intervalo de heartbeat em ms (padrão:25000)--request-timeout: Timeout de request em ms (padrão:60000, deve ser > heartbeat)--max-clients: Máximo de clientes simultâneos (padrão:10)
Deploy no Deno Deploy (MCP Remoto)
Um servidor remoto já está disponível publicamente em:
https://youtube-transcript-mcp.deno.dev
Usar o servidor público
Configure diretamente no seu host MCP (Claude Desktop, Cursor, VS Code, etc.):
{
"mcpServers": {
"youtube-transcript-remote": {
"url": "https://youtube-transcript-mcp.deno.dev/mcp"
}
}
}
Por que um entrypoint separado para Deno Deploy?
O Deno Deploy é serverless (isolates): não existe processo persistente, então node:http .listen() não funciona. O src/deno-deploy.js implementa o protocolo MCP/SSE usando exclusivamente a Web Fetch API (Deno.serve, Request, Response, ReadableStream), que é o único modelo suportado.
Em ambiente local, o Deno 2 é compatível com node:http e o start:remote funciona normalmente — o entrypoint dedicado só é necessário para o Deno Deploy.
Fazer seu próprio deploy
# 1. Instalar deployctl
deno install -gArf jsr:@deno/deployctl
# 2. Autenticar (abre browser)
deployctl login
# 3. Deploy
deployctl deploy --project=<nome-do-projeto> src/deno-deploy.js
Testar localmente antes do deploy
deno task start # porta 8000
curl -N http://localhost:8000/mcp
# event: endpoint
# data: "/mcp?sessionId=<uuid>"
Protocolo SSE exposto
| Método | Endpoint | Descrição |
|---|---|---|
GET |
/mcp |
Abre stream SSE, envia event: endpoint com o sessionId |
POST |
/mcp?sessionId=<id> |
Recebe mensagem JSON-RPC, retorna HTTP 202, envia resposta pelo SSE |
OPTIONS |
* |
CORS preflight (permite *) |
Métodos MCP suportados: initialize, ping, tools/list, tools/call.
Formato de entrade e saída
Entrada:
{
"videoUrl": "https://www.youtube.com/watch?v=dQw4w9WgXcQ",
"preferredLanguages": ["pt-BR", "en"]
}
Saída (exemplo abreviado) CLI:
[
{ "text": "Intro...", "startInMs": 0, "duration": 2300 },
{ "text": "Next segment...", "startInMs": 2300, "duration": 1800 }
]
MCP (content type text):
{
"content": [
{ "type": "text", "text": "[{\"text\":\"Intro...\",\"startInMs\":0,\"duration\":2300}]" }
]
}
Regras de Seleção de Legenda
Prioridade: manual idioma preferido > automática idioma preferido > track padrão > primeira disponível. Matching de idioma: case-insensitive + prefixo ("pt" casa "pt-BR").
Comportamento de Erro
Retorna null em qualquer falha. Logs internos categorizam causa.
Limitações
- Sem cache interno
- Sem truncamento de resposta
- Sem persistência em disco
Desenvolvimento
- Node 18+ / Deno 2+
- JavaScript ESM
Scripts:
npm test # testes Node
npm run lint # ESLint
npm run start:deno # servidor Deno local (porta 8000)
npm run dev:deno # servidor Deno com watch
Testes Esperados
- URL inválida →
null - Sem legendas →
null - Fallback automático de idioma funciona
- Parsing de dois formatos XML suportados
Recommended Servers
playwright-mcp
A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.
Magic Component Platform (MCP)
An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.
Audiense Insights MCP Server
Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.
VeyraX MCP
Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.
graphlit-mcp-server
The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.
Kagi MCP Server
An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.
E2B
Using MCP to run code via e2b.
Neon Database
MCP server for interacting with Neon Management API and databases
Qdrant Server
This repository is an example of how to create a MCP server for Qdrant, a vector search engine.
Exa Search
A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.