ArXiv MCP Server
Enables AI assistants to search, download, and read arXiv papers, with automatic detection of open-source code repositories and support for both LaTeX and PDF content.
README
ArXiv MCP Server
通过 Model Context Protocol (MCP) 为 AI 助手提供与 arXiv 研究库的桥梁,支持搜索论文和访问其内容。
致谢
本项目基于 blazickjp/arxiv-mcp-server 进行修改和优化,感谢原作者的卓越贡献。
与原项目的区别
- 下载逻辑优化:移除了
paper.md中间文件的生成流程,改为直接从源文件读取内容(优先 LaTeX,否则 PDF) - 双格式下载:同时下载 LaTeX 源文件和 PDF 文件,而不是只下载一种格式
- API 重试机制:添加了针对 arXiv API 速率限制(HTTP 429)的自动重试机制,最多重试 3 次
- 简化功能:移除了
list_papers工具和prompts功能,专注于核心的搜索、下载和读取功能
功能
- 论文搜索:查询 arXiv 论文,支持日期范围和分类过滤
- 论文下载:同时下载 LaTeX 源文件和 PDF 文件
- 智能缓存:基于 arXiv ID 自动检测是否已下载,避免重复下载
- 论文读取:直接从源文件读取论文内容(LaTeX 或 PDF)
- 代码检测:自动检测开源代码仓库(GitHub、GitLab、HuggingFace 等)
安装
# 克隆代码仓库
git clone https://github.com/YOUR_USERNAME/arxiv-mcp-server.git
cd arxiv-mcp-server
# 创建并激活虚拟环境
uv venv
source .venv/bin/activate
# 安装依赖
uv pip install -e .
配置
以 claude code 为例
编辑 ~/.claude.json,在 mcpServers 中添加:
{
"mcpServers": {
"arxiv-mcp-server": {
"command": "uv",
"args": [
"--directory",
"/path/to/arxiv-mcp-server",
"run",
"arxiv-mcp-server"
]
}
}
}
将 /path/to/arxiv-mcp-server 替换为实际的项目路径,然后完全退出并重新启动 Claude Desktop。
可用工具
search_papers
搜索 arXiv 论文
参数(均可修改):
query: 搜索查询(必需)max_results: 最大返回结果数,默认 10,最大 50date_from: 起始日期,格式 YYYY-MM-DDdate_to: 结束日期,格式 YYYY-MM-DDcategories: arXiv 分类数组,如 ["cs.AI", "cs.LG"]sort_by: 排序方式,"relevance"(相关度)或 "date"(日期)
返回:论文列表(id、title、abstract、published、url、code_url)
download_paper
下载论文到本地
参数:
paper_id: arXiv 论文 ID(必需)
返回:下载状态、论文目录、是否包含 LaTeX 和 PDF
read_paper
读取论文内容
参数:
paper_id: arXiv 论文 ID(必需)
特点:
- 如果论文未下载,会自动调用
download_paper工具下载 - 直接从源文件读取(优先 LaTeX,否则 PDF)
- 不生成中间文件
返回:论文完整内容、来源格式(LaTeX 或 PDF)
存储路径与命名规则
默认路径
论文默认存储在项目根目录下的 papers/ 文件夹中。
目录结构
papers/
├── {arXiv_ID}_{sanitized_title}/
│ ├── main.tex
│ ├── references.bib
│ ├── figures/
│ └── paper.pdf
命名规则
- 论文目录:
{arXiv_ID}_{sanitized_title}arXiv_ID:论文的 arXiv 标识符(如2502.12345)sanitized_title:论文标题的清理版本(小写、空格替换为下划线、移除特殊字符)
- 示例:
2502.12345_deep_learning_models/
格式说明
- LaTeX 源文件:解压后的
.tex、.bib、figures/等源代码文件 - PDF 文件:论文的 PDF 文件,文件名为
paper.pdf
注意事项
- arXiv API 有速率限制,短时间内大量请求会返回 HTTP 429 错误,服务器会自动重试最多 3 次
- 论文 ID 格式:
2502.12345或cs.AI/2502.12345
许可证
本项目采用 MIT 许可证。详情请参阅 LICENSE 文件。
Recommended Servers
playwright-mcp
A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.
Magic Component Platform (MCP)
An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.
Audiense Insights MCP Server
Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.
VeyraX MCP
Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.
graphlit-mcp-server
The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.
Kagi MCP Server
An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.
E2B
Using MCP to run code via e2b.
Neon Database
MCP server for interacting with Neon Management API and databases
Exa Search
A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.
Qdrant Server
This repository is an example of how to create a MCP server for Qdrant, a vector search engine.