MCP Agentic RAG
Enables querying a vector database of machine learning FAQs and performing web searches using Bright Data proxies through Claude Desktop with structured agent prompts.
README
🤖 MCP Agentic RAG com Qdrant e Bright Data
Este projeto implementa um servidor MCP (Model Context Protocol) com ferramentas inteligentes para:
- 🔍 Buscar respostas em uma base vetorial de perguntas frequentes sobre machine learning
- 🌐 Realizar pesquisas web usando proxy premium da Bright Data
- 💡 Usar agentes via Claude Desktop com prompts estruturados
⚙️ Tecnologias
- 🧠 LlamaIndex com modelo
nomic-embed-text-v1.5 - 📦 Qdrant como banco vetorial local (via Docker)
- 🌍 Bright Data para scraping com proxy
- 🧠 Claude Desktop como cliente LLM
- ⚡ FastMCP como servidor MCP
- Python 3.11+
🧪 Configuração rápida
1. Clone o projeto e crie o ambiente
git clone https://seurepo.com/mcp_agentic_rag.git
cd mcp_agentic_rag
python -m venv .venv
.venv\Scripts\activate
pip install -r requirements.txt
2. Configure seu arquivo .env
Crie o arquivo .env com suas credenciais Bright Data:
BRIGHT_DATA_USERNAME=brd-customer-usuario-zone-nomezona
BRIGHT_DATA_PASSWORD=sua_senha
3. Suba o Qdrant via Docker
docker run -p 6333:6333 -p 6334:6334 ^
-v ${PWD}/qdrant_storage:/qdrant/storage ^
qdrant/qdrant
4. Ingestão de FAQ no banco vetorial
python ingest_faq.py
Você verá mensagens como:
✅ Coleção 'ml_faq_collection' populada com sucesso no Qdrant.
5. Inicie o servidor MCP
python server.py
6. Configure o Claude Desktop
Adicione este conteúdo ao seu config.json em:
Claude Desktop > Settings > MCP Servers
{
"mcpServers": {
"mcp-rag-app": {
"command": "python",
"args": ["C:\\Seu_Path\\mcp_agentic_rag\\server.py"],
"host": "127.0.0.1",
"port": 8080,
"timeout": 30000
}
}
}
🚀 Como usar
✅ Prompt 1 – Buscar em base FAQ:
Você é um assistente especializado em aprendizado de máquina.
Use a ferramenta "machine_learning_faq_retrieval_tool" para responder perguntas como:
"Como evitar overfitting em modelos de machine learning?"
✅ Prompt 2 – Pesquisa via Bright Data:
Você é um assistente de conhecimento geral.
Use "bright_data_web_search_tool" para perguntas como:
"Qual o impacto atual da inteligência artificial no setor bancário brasileiro?"
🧰 Scripts úteis
ingest_faq.py→ Gera embeddings e popula Qdrant com FAQserver.py→ Inicia o servidor MCP com as ferramentasteste.py→ Faz busca manual na coleção FAQ para debugprompt_1.yml,prompt_2.yml→ Exemplos para Claude Desktoprag_code.py→ Lógica de vetorização e busca.env→ Armazena credenciais do Bright Dataconfig.json→ Registro local de servidor MCP no Claude
📬 Informação - Este projeto foi adaptado do projeto mcp_agentic_rag
Para mais projetos de IA, veja o Daily Dose of Data Science
🤝 Contribuições
Contribuições são bem-vindas! Faça um fork, crie um branch, adicione melhorias e envie um PR 🚀
Recommended Servers
playwright-mcp
A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.
Magic Component Platform (MCP)
An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.
Audiense Insights MCP Server
Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.
VeyraX MCP
Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.
graphlit-mcp-server
The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.
Kagi MCP Server
An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.
E2B
Using MCP to run code via e2b.
Neon Database
MCP server for interacting with Neon Management API and databases
Exa Search
A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.
Qdrant Server
This repository is an example of how to create a MCP server for Qdrant, a vector search engine.