Naver Real Estate MCP

Naver Real Estate MCP

Enables automated collection of apartment listing data from Naver Real Estate using Playwright browser automation with passive network response capture. Provides MCP tools to search complexes, resolve property identifiers, and extract normalized listing information including duplicate properties.

Category
Visit Server

README

naverestate-mcp

네이버 부동산 수집을 위한 Playwright + MCP 프로젝트.

목표

  • 네이버 부동산 페이지를 실제 브라우저로 열고 public 흐름으로 접근
  • UI 상호작용(필터, 스크롤, 중복매물 펼치기)을 Playwright로 수행
  • 그 과정에서 발생한 내부 네트워크 응답을 passive capture
  • 수집 결과를 정규화하고 MCP tool로 노출

설계 원칙

  • 기본 모드는 passive network capture
    • 브라우저가 실제로 발생시킨 요청/응답만 캡처
    • 도구가 내부 API를 새로 직접 때리는 active harvester를 기본으로 두지 않음
  • 브라우저 조작과 도메인 로직을 분리
  • jipxl의 확장프로그램 구조는 버리고, 재사용 가능한 타입/정규화 로직만 선별 이관
  • 로그인 없는 public 흐름을 기본으로 한다
  • 캐시는 아파트 이름 전체를 key로 사용하고, 구/동은 metadata로만 저장한다
  • 네이버 부동산이 새 Playwright 컨텍스트를 차단할 수 있으므로, 필요하면 기존 Chrome에 CDP attach 하는 경로를 지원한다

패키지 구조

  • packages/collector-core
    • 타입, 정규화, 그룹핑, 결과 모델
  • packages/playwright-driver
    • persistent context, response capture registry, collector driver
  • packages/mcp-server
    • MCP tool spec, server entry skeleton

현재 상태

현재 기본 수집은 실제 동작 확인 완료:

  • TypeScript workspace 구조
  • collector-core 타입/그룹핑/정규화
  • playwright-driver 수집 동작 확인
  • mcp-server tool 호출 가능
  • 고덕그라시움(complexNo=113907) 기준 검증 완료
    • 대표매물 수집 성공
    • 중복매물 수집 성공
    • JSON 저장 성공

최근 반영 사항

  • 새 Playwright Chrome에서 네이버 부동산이 404로 튕기던 문제 수정
    • --disable-blink-features=AutomationControlled
    • navigator.webdriver = false
    • navigator.languages 보정
  • overview 응답 패턴 수정
    • /api/complexes/overview/{complexNo} 캡처 지원
  • 동일매물 묶기 체크 로직 수정
    • checkbox 직접 클릭 대신 label click / force setChecked fallback
  • 중복매물 응답 파싱 수정
    • /api/articles?representativeArticleNo=... 응답의 array payload 지원

현재 기본 수집 전제

  • collectDuplicates는 옵션으로 둔다
    • true: 중복매물까지 수집
    • false: 대표매물 목록까지만 수집
  • 검색/수집 기본 정렬은 항상 최신순(dateDesc) 으로 고정한다
  • 캐시는 아파트 이름 전체 기준으로 저장한다

실행 방법

1) 기본 실행 (권장 시작점)

새 Playwright persistent Chrome 프로필로 실행한다.

cd /Users/hyunsu/.openclaw/workspace/naverestate-mcp
npm run build
node packages/mcp-server/dist/index.js

현재는 anti-detection 보정이 들어가 있어서, 기본 persistent 실행만으로도 네이버 부동산 상세 진입이 가능하다.

2) CDP attach 모드

환경변수로 기존 Chrome 디버깅 엔드포인트를 넘기면, 새 Playwright 프로필 대신 기존 브라우저에 붙을 수 있다.

export NAVER_CDP_ENDPOINT_URL=http://127.0.0.1:9222
node packages/mcp-server/dist/index.js

권장 용도:

  • 이미 사람이 열어둔 실제 Chrome 세션을 재사용하고 싶을 때
  • Playwright 프로필과 실제 사용자 브라우저 동작 차이를 비교할 때

MCP 도구

현재 stdio MCP 서버에서 제공하는 도구는 아래 4개다.

Tool 설명
naver_search_complex 키워드로 단지 자동완성 후보 검색
naver_resolve_complex 후보를 complexNo로 resolve하고 cache 저장
naver_collect_complex 단지 상세에서 대표매물 + 중복매물 수집
naver_get_last_result 마지막 수집 JSON 다시 가져오기

호출 예시

Search

{
  "name": "naver_search_complex",
  "arguments": {
    "keyword": "고덕그라시움"
  }
}

Resolve

{
  "name": "naver_resolve_complex",
  "arguments": {
    "apartmentName": "고덕그라시움",
    "fullLabel": "고덕동 고덕그라시움"
  }
}

Collect

{
  "name": "naver_collect_complex",
  "arguments": {
    "filter": {
      "complexNo": "113907",
      "tradeTypes": ["A1"]
    },
    "collectDuplicates": true
  }
}

Get last result

{
  "name": "naver_get_last_result",
  "arguments": {}
}

현재 결과 모델 요약

수집 결과 JSON은 아래 필드를 포함한다.

  • complex: 단지 개요
  • articlePages: 대표매물 목록 원본 응답들
  • duplicateResponses: 중복매물 원본 응답들
  • articles: 대표매물 정규화 목록
  • duplicateGroups: representativeArticleNo 기준 중복매물 묶음
  • listingGroups: 대표매물 + duplicates 합친 최종 구조

검증된 샘플

고덕그라시움(complexNo=113907) 기준 최근 검증 결과:

  • 대표매물 212
  • 중복 묶음 89
  • JSON 저장 성공

Recommended Servers

playwright-mcp

playwright-mcp

A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.

Official
Featured
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.

Official
Featured
Local
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.

Official
Featured
Local
TypeScript
VeyraX MCP

VeyraX MCP

Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.

Official
Featured
Local
graphlit-mcp-server

graphlit-mcp-server

The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.

Official
Featured
TypeScript
Kagi MCP Server

Kagi MCP Server

An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.

Official
Featured
Python
E2B

E2B

Using MCP to run code via e2b.

Official
Featured
Neon Database

Neon Database

MCP server for interacting with Neon Management API and databases

Official
Featured
Exa Search

Exa Search

A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.

Official
Featured
Qdrant Server

Qdrant Server

This repository is an example of how to create a MCP server for Qdrant, a vector search engine.

Official
Featured