MCP Servers

Agentic RAG MCP Server

An intelligent Retrieval-Augmented Generation (RAG) application that uses the Model Context Protocol (MCP) to automatically decide between searching a private knowledge base or the web.

README

MCP-Powered Agentic RAG Application

Uma aplicação inteligente de Retrieval-Augmented Generation (RAG) que usa o Model Context Protocol (MCP) para decidir automaticamente entre buscar informações em uma base de conhecimento privada ou realizar buscas na web.

🎯 Visão Geral

Esta aplicação implementa um agente inteligente que pode:

Buscar em base de conhecimento privada: Usa um banco de dados vetorial (Qdrant) para consultar FAQs sobre Python
Buscar na web: Usa a API Firecrawl para obter informações atualizadas da internet
Decidir automaticamente: O agente escolhe a ferramenta apropriada com base na consulta do usuário

🏗️ Arquitetura

┌─────────────┐
│   Usuário   │
└──────┬──────┘
       │ Query
       ▼
┌─────────────────┐
│  MCP Cliente    │
└──────┬──────────┘
       │
       ▼
┌─────────────────────────────────────┐
│        MCP Server (Agente)          │
│  ┌───────────────────────────────┐  │
│  │  Decisão Inteligente de Tool  │  │
│  └───────────┬───────────────────┘  │
│              │                      │
│      ┌───────┴────────┐             │
│      ▼                ▼             │
│  ┌────────┐      ┌─────────┐        │
│  │Vector  │      │   Web   │        │
│  │DB Tool │      │Search   │        │
│  └────┬───┘      └────┬────┘        │
└───────┼───────────────┼─────────────┘
        │               │
        ▼               ▼
   ┌─────────┐    ┌──────────┐
   │ Qdrant  │    │Firecrawl │
   │  (FAQ)  │    │   API    │
   └─────────┘    └──────────┘

🚀 Instalação

Pré-requisitos

Python 3.8+
Docker e Docker Compose
Chave API do Firecrawl (obtenha em firecrawl.dev)

Passo a Passo

Clone ou navegue até o diretório do projeto

cd /home/seaddados/projetos/mcp-agentic-rag

Configure as variáveis de ambiente

# Edite o arquivo .env e adicione sua chave API
nano .env

Adicione:

FIRECRAWL_API_KEY=sua_chave_api_aqui

Inicie o Qdrant (banco de dados vetorial)
```
docker-compose up -d
```
Verifique se está rodando:
```
curl http://localhost:6334/
```

Crie um ambiente virtual e instale as dependências

python -m venv venv
source venv/bin/activate  # No Linux/Mac
# ou
# venv\Scripts\activate  # No Windows

pip install -r requirements.txt

🚀 Como Usar

Método 1: Cliente MCP Oficial (⭐ Recomendado para Produção)

cd /home/seaddados/projetos/mcp-agentic-rag
source venv/bin/activate

# Terminal 1 - Servidor
python3 mcp_server.py

# Terminal 2 - Cliente
python3 mcp_client.py

Vantagens:

✅ Usa protocolo MCP oficial
✅ Comunicação STDIO nativa
✅ Lista ferramentas automaticamente
✅ Testa todas as 3 ferramentas (FAQ, Web Search, Shell)

Método 2: Testes Diretos (🔧 Recomendado para Desenvolvimento)

python3 test_tools.py

Vantagens:

✅ Mais rápido
✅ Não precisa de servidor
✅ Testa lógica diretamente
✅ Ideal para debug

🔧 Configuração de Transport

O servidor suporta dois modos de transporte:

STDIO (Padrão)

python3 mcp_server.py
# Usa STDIO para clientes MCP oficiais

SSE (HTTP)

MCP_TRANSPORT=sse python3 mcp_server.py
# Usa SSE para testes HTTP

# Em outro terminal
python3 mcp_client_http.py

Saída do Servidor

Modo STDIO:

============================================================
MCP AGENTIC RAG APPLICATION
============================================================

Initializing FAQ Engine and setting up Qdrant collection...
Embedding model loaded. Vector dimension: 384
Connected to Qdrant.

============================================================
Starting MCP server
============================================================

Available Tools:
  1. python_faq_retrieval_tool - Search Python FAQ knowledge base
  2. firecrawl_web_search_tool - Search the web for information
  3. execute_shell_command - Execute shell commands

✓ Transport: STDIO
Server is ready to accept STDIO connections!

Modo HTTP/SSE:

✓ Transport: SSE (HTTP)
✓ Server URL: http://127.0.0.1:8080/sse
Server is ready to accept HTTP connections!
INFO:     Uvicorn running on http://127.0.0.1:8080 (Press CTRL+C to quit)

🎯 Diferenças Entre os Clientes

Cliente	Protocolo	SDK	Uso	Vantagem
mcp_client.py ⭐	MCP via STDIO	MCP Python SDK oficial	Produção, integração real	Protocolo nativo, robusto
mcp_client_http.py 🌐	HTTP/SSE	MCP Python SDK (SSE)	Testes, debugging	Fácil inspeção HTTP
test_tools.py 🔧	Import direto	Nenhum	Desenvolvimento rápido	Simples, sem overhead
test_client.py ⚠️	HTTP/SSE (legado)	Requests	Não recomendado	Protocolo SSE complexo

📁 Estrutura do Projeto

mcp-agentic-rag/
├── mcp_server.py          # Servidor MCP (STDIO/SSE)
├── mcp_client.py          # ⭐ Cliente MCP oficial (STDIO)
├── mcp_client_http.py     # 🌐 Cliente MCP HTTP (SSE)
├── rag_app.py             # Pipeline RAG com Qdrant
├── test_tools.py          # Testes diretos das ferramentas
├── test_client.py         # Cliente HTTP legado
├── .env                   # Variáveis de ambiente
├── requirements.txt       # Dependências Python
├── docker-compose.yml     # Configuração Qdrant
├── README.md              # Esta documentação
├── TROUBLESHOOTING.md     # Guia de resolução de problemas
└── start_server.sh        # Script de inicialização

Exemplo 1: Consulta sobre Python (usa Vector DB)

curl -X POST http://127.0.0.1:8080/mcp \
-H "Content-Type: application/json" \
-d '{
  "messages": [
    {
      "role": "user",
      "content": "Can you explain list comprehensions in Python?"
    }
  ]
}'

Exemplo 2: Consulta geral (usa Web Search)

curl -X POST http://127.0.0.1:8080/mcp \
-H "Content-Type: application/json" \
-d '{
  "messages": [
    {
      "role": "user",
      "content": "What is the new Polars DataFrame library?"
    }
  ]
}'

🛠️ Componentes

1. RAG Pipeline (`rag_app.py`)

FAQEngine: Classe principal para embeddings e busca vetorial
PYTHON_FAQ_TEXT: Base de conhecimento com FAQs sobre Python
batch_generator: Processamento eficiente em lotes

2. MCP Server (`mcp_server.py`)

Servidor que implementa três ferramentas MCP:

python_faq_retrieval_tool: Busca na base de conhecimento privada (Qdrant)
firecrawl_web_search_tool: Busca informações na web via Firecrawl API
execute_shell_command: Executa comandos shell no workspace

Suporte a múltiplos transportes:

STDIO (padrão): Para integração com clientes MCP oficiais
HTTP/SSE: Para testes e debugging via HTTP

3. MCP Clients

`mcp_client.py` - Cliente STDIO

Cliente oficial usando transporte STDIO. Inclui:

call_tool(): Função genérica para ferramentas com parâmetro query
call_tool_cmd(): Função especializada para execute_shell_command (usa parâmetro cmd)
list_available_tools(): Lista todas as ferramentas disponíveis

`mcp_client_http.py` - Cliente HTTP/SSE

Cliente HTTP usando Server-Sent Events. Mesmas funcionalidades do cliente STDIO, mas via HTTP.

Exemplo de uso da função call_tool_cmd:

# Para ferramentas que usam 'query' (FAQ e Web Search)
await call_tool(session, "python_faq_retrieval_tool", "What are decorators?")

# Para ferramentas que usam 'cmd' (Shell Commands)
await call_tool_cmd(session, "execute_shell_command", "ls -la")

🔧 Configuração

Variáveis de Ambiente (`.env`)

# Obrigatório para busca web
FIRECRAWL_API_KEY=sua_chave_aqui

# Opcional (para futuras melhorias)
OPENAI_API_KEY=sk-...

Configurações do Servidor (`mcp_server.py`)

QDRANT_URL = "http://localhost:6333"
COLLECTION_NAME = "python_faq_collection"
HOST = "127.0.0.1"
PORT = 8080

📊 Interface Web do Qdrant

Acesse o dashboard do Qdrant em: http://localhost:6334/

Aqui você pode:

Visualizar coleções
Inspecionar vetores
Monitorar o desempenho

🧪 Testes

Ambos os clientes (mcp_client.py e mcp_client_http.py) incluem 5 casos de teste:

List Comprehensions → Python FAQ Tool (Vector DB)
Python Decorators → Python FAQ Tool (Vector DB)
== vs is → Python FAQ Tool (Vector DB)
Polars Library → Web Search Tool
List files (ls -la) → Shell Command Tool

Executar testes:

# Modo STDIO
python mcp_client.py

# Modo HTTP/SSE (requer servidor em modo SSE)
python mcp_client_http.py

🐛 Troubleshooting

Erro: "FIRECRAWL_API_KEY environment variable is not set"

Verifique se o arquivo .env existe e contém a chave API
Certifique-se de que o arquivo está no mesmo diretório que mcp_server.py

Erro: "Error connecting to Qdrant"

Verifique se o Docker está rodando: docker ps
Inicie o Qdrant: docker-compose up -d
Verifique os logs: docker-compose logs qdrant

Modelo de embedding demora para carregar

Na primeira execução, o modelo (~500MB) será baixado
Execuções subsequentes serão mais rápidas (modelo em cache)

📚 Recursos Adicionais

✨ Melhorias Implementadas

Durante o desenvolvimento, os seguintes problemas foram resolvidos:

Problema	Solução
⏱️ Timeout HuggingFace	Modelo menor (384 dim) `all-MiniLM-L6-v2`
🔢 Vector dimension mismatch	Coleção Qdrant recriada com dimensão correta
⚠️ Qdrant API deprecated	Atualizado com fallback para compatibilidade
🔌 Transport incompatível	STDIO + SSE suportados simultaneamente
❌ Cliente HTTP falho	Cliente MCP oficial criado com SDK ✅
🛠️ Shell commands	Nova ferramenta `execute_shell_command` adicionada

🎓 Próximos Passos Sugeridos

1. Adicionar Mais FAQs

# Edite PYTHON_FAQ_TEXT em rag_app.py
# Execute para recriar a coleção:
python3 -c "from rag_app import FAQEngine, PYTHON_FAQ_TEXT; \
            engine = FAQEngine('http://localhost:6333', 'python_faq_collection'); \
            engine.setup_collection(PYTHON_FAQ_TEXT)"

2. Integrar com Claude Desktop

Adicione ao arquivo de configuração do Claude Desktop:

{
  "mcpServers": {
    "python-faq": {
      "command": "python3",
      "args": ["mcp_server.py"],
      "cwd": "/home/seaddados/projetos/mcp-agentic-rag",
      "env": {
        "FIRECRAWL_API_KEY": "sua_chave_aqui"
      }
    }
  }
}

3. Adicionar Novas Ferramentas MCP

Exemplo de como criar uma nova ferramenta:

@mcp_server.tool()
def nova_ferramenta(parametro: str) -> str:
    """
    Descrição detalhada da ferramenta.
    Use esta ferramenta quando...
    
    Args:
        parametro: Descrição do parâmetro
        
    Returns:
        Resultado da operação
    """
    # Implementação
    resultado = processar(parametro)
    return resultado

4. Expandir Base de Conhecimento

Adicionar documentação de outras linguagens (JavaScript, Go, Rust)
Incluir best practices e design patterns
Adicionar troubleshooting guides específicos

5. Melhorar Busca Web

Implementar cache de resultados
Adicionar mais fontes de busca (DuckDuckGo, Brave Search)
Filtrar resultados por relevância

🤝 Contribuindo

Sinta-se à vontade para:

Adicionar mais FAQs à base de conhecimento
Implementar novas ferramentas MCP
Melhorar a lógica de seleção de ferramentas
Adicionar testes adicionais

📝 Licença

Este projeto é baseado no artigo "Building MCP-Powered Agentic RAG Application" de Youssef Hosni.

Desenvolvido com ❤️ usando Model Context Protocol

Recommended Servers

playwright-mcp

A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.

Official

Featured

TypeScript

Magic Component Platform (MCP)

An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.

Audiense Insights MCP Server

Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.

VeyraX MCP

Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.

Official

Featured

Local

graphlit-mcp-server

The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.

Official

Featured

TypeScript

Kagi MCP Server

An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.

Official

Featured

Python

E2B

Using MCP to run code via e2b.

Official

Featured

Neon Database

MCP server for interacting with Neon Management API and databases

Official

Featured

Exa Search

A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.

Official

Featured

Qdrant Server

This repository is an example of how to create a MCP server for Qdrant, a vector search engine.

Official

Featured

Agentic RAG MCP Server

README

MCP-Powered Agentic RAG Application

🎯 Visão Geral

🏗️ Arquitetura

🚀 Instalação

Pré-requisitos

Passo a Passo

🚀 Como Usar

Método 1: Cliente MCP Oficial (⭐ Recomendado para Produção)

Método 2: Testes Diretos (🔧 Recomendado para Desenvolvimento)

🔧 Configuração de Transport

STDIO (Padrão)

SSE (HTTP)

Saída do Servidor

🎯 Diferenças Entre os Clientes

📁 Estrutura do Projeto

🛠️ Componentes

1. RAG Pipeline (rag_app.py)

2. MCP Server (mcp_server.py)

3. MCP Clients

mcp_client.py - Cliente STDIO

mcp_client_http.py - Cliente HTTP/SSE

🔧 Configuração

Variáveis de Ambiente (.env)

Configurações do Servidor (mcp_server.py)

📊 Interface Web do Qdrant

🧪 Testes

🐛 Troubleshooting

Erro: "FIRECRAWL_API_KEY environment variable is not set"

Erro: "Error connecting to Qdrant"

Modelo de embedding demora para carregar

📚 Recursos Adicionais

✨ Melhorias Implementadas

🎓 Próximos Passos Sugeridos

1. Adicionar Mais FAQs

2. Integrar com Claude Desktop

3. Adicionar Novas Ferramentas MCP

4. Expandir Base de Conhecimento

5. Melhorar Busca Web

🤝 Contribuindo

📝 Licença

Recommended Servers

1. RAG Pipeline (`rag_app.py`)

2. MCP Server (`mcp_server.py`)

`mcp_client.py` - Cliente STDIO

`mcp_client_http.py` - Cliente HTTP/SSE

Variáveis de Ambiente (`.env`)

Configurações do Servidor (`mcp_server.py`)