linkedin-analyzer

linkedin-analyzer

Analyzes LinkedIn profiles for specific companies and roles to extract career patterns and insights using AI.

Category
Visit Server

README

LinkedIn Career Intelligence Analyzer

LinkedIn'de belirli şirket ve pozisyondaki çalışanların profillerini analiz ederek kariyer yol haritası çıkarır.

💡 Neden Bu Projeyi Yaptım?

Kariyer planlaması yaparken hep şunu merak etmişimdir: "Google'da Software Engineer olan insanlar nasıl oraya ulaştılar?" LinkedIn'de tek tek profillere bakıp not almak çok zahmetli ve verimsizdi.

Bu projeyle şunu çözmeye çalıştım: Hedeflediğim şirket ve pozisyondaki onlarca kişinin profilini otomatik toplayıp, AI ile analiz edip, ortak paternleri bulmak. Mesela hangi üniversitelerden geliyorlar, hangi teknolojileri biliyorlar, hangi sertifikaları almışlar gibi.

Başlangıçta sadece kendim için bir script yazmayı düşünmüştüm ama sonra dedim ki "Bunu düzgün bir web uygulaması haline getireyim, başkaları da kullansın". TypeScript ile yazdım çünkü type safety seviyorum, Playwright ile scraping yaptım çünkü LinkedIn'in dinamik yapısıyla baş edebiliyordu, Claude AI kullandım çünkü profil verisini anlamlandırmada çok iyiydi.

Proje şu an hem web arayüzü hem CLI hem de MCP sunucu olarak çalışabiliyor. En çok kullandığım özelliği web arayüzü oldu açıkçası, çok pratik.

🎯 Özellikler

  • 🌐 Web Arayüzü - Tarayıcıdan kullanılabilir modern UI
  • 🔍 LinkedIn profil araması (Playwright MCP ile)
  • 🤖 Otomatik profil veri çıkarma
  • 📊 Claude API ile akıllı analiz
  • 📄 HTML/JSON rapor üretimi
  • 🔌 MCP sunucu olarak kullanılabilme
  • 💻 CLI desteği

📦 Kurulum

# Bağımlılıkları yükle
npm install

# TypeScript'i derle
npm run build

# .env dosyası oluştur
cp .env.example .env
# .env dosyasını düzenle ve ANTHROPIC_API_KEY ekle

🚀 Kullanım

🌐 Web Arayüzü ile (Önerilen)

# Sunucuyu başlat
npm run web

# Tarayıcıda aç
open http://localhost:3000

Web arayüzünden:

  1. Şirket adını ve pozisyonu girin
  2. Opsiyonel parametreleri ayarlayın
  3. "Analizi Başlat" butonuna tıklayın
  4. Sonuçları görüntüleyin ve raporu indirin

Port değiştirme:

PORT=8080 npm run web

💻 CLI ile

# Temel kullanım
node dist/cli.js --company "Google" --role "Software Engineer" --count 20

# Tüm özelliklerle
node dist/cli.js \
  --company "Trendyol" \
  --role "Backend Engineer" \
  --department "Platform" \
  --count 25 \
  --certs \
  --extras \
  --output both

Parametreler

  • --company (zorunlu): Hedef şirket adı
  • --role (zorunlu): Hedef pozisyon
  • --department (opsiyonel): Departman filtresi
  • --count (opsiyonel): Profil sayısı (5-50, default: 15)
  • --output (opsiyonel): Çıktı formatı (html|json|both, default: html)
  • --certs: Sertifika analizini dahil et
  • --extras: Yan projeler, yayınlar, açık kaynak katkılarını dahil et

🔧 MCP Sunucu Olarak

# MCP sunucusunu başlat
npm run mcp

Claude Desktop config'e ekle (~/.claude/claude_desktop_config.json):

{
  "mcpServers": {
    "linkedin-analyzer": {
      "command": "node",
      "args": ["/path/to/dist/mcp-server.js"],
      "env": {
        "ANTHROPIC_API_KEY": "your-api-key"
      }
    }
  }
}

📊 Çıktı Örneği

Analiz tamamlandığında reports/ klasöründe HTML raporu oluşturulur:

  • En sık görülen yetkinlikler (grafik ile)
  • Eğitim istatistikleri
  • Sık görülen sertifikalar
  • Ek aktiviteler (açık kaynak, yayınlar, vb.)

⚠️ Önemli Notlar

LinkedIn Bot Koruması

  • Her profil arasında 3-7 saniye bekleme
  • Günlük max 50 profil tarama
  • Playwright headless=false modda çalışmalı
  • LinkedIn'e giriş yapmış olmalısınız

Playwright MCP Kurulumu

# Playwright MCP'yi yükle
npx @playwright/mcp@latest

Claude Desktop config'e Playwright ekle:

{
  "mcpServers": {
    "playwright": {
      "command": "npx",
      "args": ["@playwright/mcp@latest"],
      "env": {
        "PLAYWRIGHT_HEADLESS": "false"
      }
    }
  }
}

🏗️ Proje Yapısı

linkedin-analyzer/
├── src/
│   ├── web-server.ts          # 🌐 Express web sunucusu
│   ├── cli.ts                 # CLI giriş noktası
│   ├── mcp-server.ts          # MCP sunucu
│   ├── orchestrator.ts        # Ana orkestrasyon
│   ├── types.ts               # TypeScript tipleri
│   ├── logger.ts              # Winston logger
│   ├── utils.ts               # Yardımcı fonksiyonlar
│   ├── linkedin/
│   │   ├── searcher.ts        # LinkedIn arama
│   │   └── scraper.ts         # Profil scraping
│   ├── analyzer/
│   │   └── profile-analyzer.ts # Profil analizi
│   └── ui/
│       └── report-generator.ts # Rapor üretimi
├── public/                    # 🌐 Web arayüzü
│   ├── index.html             # Ana sayfa
│   ├── css/
│   │   └── style.css          # Stiller
│   └── js/
│       └── app.js             # Frontend JavaScript
├── prompts/
│   ├── extract_profile.md     # Profil çıkarma promptu
│   └── analyze_profiles.md    # Analiz promptu
├── config/
│   ├── mcp-config.json        # MCP yapılandırması
│   └── output_schema.json     # Çıktı şeması
└── reports/                   # Üretilen raporlar

🔌 API Endpoints

Web sunucusu aşağıdaki API endpoint'lerini sunar:

POST /api/analyze

LinkedIn profil analizi başlatır.

Request Body:

{
  "company": "Google",
  "role": "Software Engineer",
  "department": "Machine Learning",
  "profile_count": 20,
  "include_certifications": true,
  "include_extras": true
}

Response:

{
  "analysisId": "analysis_1234567890_abc123",
  "company": "Google",
  "role": "Software Engineer",
  "profileCount": 20,
  "topSkills": [...],
  "educationStats": {...},
  ...
}

GET /api/report/:analysisId

Analiz raporunu JSON olarak indirir.

GET /api/health

Sunucu sağlık kontrolü.

📝 Geliştirme

# Geliştirme modunda çalıştır (otomatik derleme)
npm run dev

# Test çalıştır
npm test

# Build
npm run build

# Web sunucusunu başlat
npm run web

🔐 Güvenlik ve Gizlilik

  • Kişisel bilgiler (isim, fotoğraf, profil URL) raporlara dahil edilmez
  • Yalnızca anonimleştirilmiş yetkinlik verisi saklanır
  • Ham profil verisi diske yazılmaz

🛠️ Teknik Detaylar ve Öğrendiklerim

Bu proje yaparken birçok şey öğrendim, bazılarını paylaşmak istiyorum:

Web Scraping Zorlukları

LinkedIn bot koruması oldukça sağlam. Başta headless modda çalıştırmayı denedim ama hemen yakaladı. Sonra Playwright'i headless=false yaptım, her profil arasına 3-7 saniye rastgele bekleme ekledim. Ayrıca günlük max 50 profil sınırı koydum ki hesap banlanmasın.

AI Prompt Engineering

Claude'a profil verisini göndermek kolaydı ama düzgün çıktı almak başta zordu. JSON schema kullandım, prompt'u markdown dosyasında tutup versiyonladım. En büyük öğrenme: AI'ya ne istediğini çok net anlatman gerekiyor, yoksa her seferinde farklı format dönüyor.

Modüler Mimari

Başta her şeyi tek dosyada yazmıştım (klasik hata). Sonra scraper, analyzer, report generator diye ayırdım. Şimdi her modül kendi işini yapıyor, test etmesi de çok daha kolay oldu.

MCP Protokolü

Anthropic'in yeni çıkardığı MCP protokolünü denedim. Baya ilginç, Claude Desktop'a tool olarak entegre edebiliyorsun projeyi. Dökümantasyonu okumak biraz zaman aldı ama değdi.

Type Safety

TypeScript kullanmak gerçekten çok işime yaradı. Özellikle profil verisi gibi kompleks objeleri handle ederken, interface'ler sayesinde hangi field'ın ne tipte olduğunu biliyorum. Compile-time'da bir sürü hatayı yakaladım.

Asenkron İşlemler

Node.js'te async/await pattern'ini iyi öğrendim bu projede. Özellikle paralel profil scraping yaparken Promise.all kullandım, çok hızlandırdı işlemi.

📄 Lisans

MIT

🤝 Katkıda Bulunma

  1. Fork edin
  2. Feature branch oluşturun (git checkout -b feature/amazing-feature)
  3. Commit edin (git commit -m 'Add some amazing feature')
  4. Push edin (git push origin feature/amazing-feature)
  5. Pull Request açın

Not: Bu proje eğitim amaçlıdır. LinkedIn'in kullanım şartlarına uygun şekilde, etik ve sorumlu kullanım önemlidir.

Recommended Servers

playwright-mcp

playwright-mcp

A Model Context Protocol server that enables LLMs to interact with web pages through structured accessibility snapshots without requiring vision models or screenshots.

Official
Featured
TypeScript
Magic Component Platform (MCP)

Magic Component Platform (MCP)

An AI-powered tool that generates modern UI components from natural language descriptions, integrating with popular IDEs to streamline UI development workflow.

Official
Featured
Local
TypeScript
Audiense Insights MCP Server

Audiense Insights MCP Server

Enables interaction with Audiense Insights accounts via the Model Context Protocol, facilitating the extraction and analysis of marketing insights and audience data including demographics, behavior, and influencer engagement.

Official
Featured
Local
TypeScript
VeyraX MCP

VeyraX MCP

Single MCP tool to connect all your favorite tools: Gmail, Calendar and 40 more.

Official
Featured
Local
graphlit-mcp-server

graphlit-mcp-server

The Model Context Protocol (MCP) Server enables integration between MCP clients and the Graphlit service. Ingest anything from Slack to Gmail to podcast feeds, in addition to web crawling, into a Graphlit project - and then retrieve relevant contents from the MCP client.

Official
Featured
TypeScript
Kagi MCP Server

Kagi MCP Server

An MCP server that integrates Kagi search capabilities with Claude AI, enabling Claude to perform real-time web searches when answering questions that require up-to-date information.

Official
Featured
Python
E2B

E2B

Using MCP to run code via e2b.

Official
Featured
Neon Database

Neon Database

MCP server for interacting with Neon Management API and databases

Official
Featured
Exa Search

Exa Search

A Model Context Protocol (MCP) server lets AI assistants like Claude use the Exa AI Search API for web searches. This setup allows AI models to get real-time web information in a safe and controlled way.

Official
Featured
Qdrant Server

Qdrant Server

This repository is an example of how to create a MCP server for Qdrant, a vector search engine.

Official
Featured