この記事ではMCPに特化して解説します。MCP(Model Context Protocol)全般は MCPサーバーの作り方2026完全ガイド をご覧ください。

Firecrawlとは — GitHub 70,000スター超のAI向けWebデータAPI

Firecrawlは、WebサイトをクロールしてLLMが扱いやすいMarkdownやJSONに変換するAPIサービスだ。Y Combinatorの支援を受けたオープンソースプロジェクトで、GitHub 70,000スター超。10万人以上の開発者が利用している。

従来のスクレイピングツールと異なり、JavaScript動的レンダリング後のページも正確に処理できる点が最大の強み。SPAやReactアプリのデータ抽出も問題ない。

主要な機能は4つ:

機能 説明 用途
Scrape 単一URLからMarkdown/JSON抽出 ページデータ取得
Crawl サイト全体を自動巡回 サイトマップ生成・全ページ収集
Search Web検索+結果スクレイピング RAG・情報収集
Extract AIプロンプトで構造化データ抽出 商品情報・価格データ収集

Firecrawl MCPでCursor・Claude Codeと連携する方法

Firecrawl MCPサーバーを導入すると、CursorやClaude CodeのAIエージェントがWebページを直接読めるようになる。MCPはAnthropicが開発した標準化通信プロトコルで、AIとツール間のシームレスな連携を実現する。

flowchart LR A["ユーザー指示
「このサイトを分析して」"] --> B["AIエージェント
MCPリクエスト生成"] B --> C["Firecrawl MCP
URLクローリング"] C --> D["JS レンダリング
DOM完全キャプチャ"] D --> E["Markdown/JSON
データ返却"] E --> F["AIが分析・
コード生成"]

Cursorでのセットアップ手順(2分)

# 1. Firecrawlアカウント作成(無料・カード不要)
# https://www.firecrawl.dev/ にアクセスしてAPIキー取得

# 2. Cursorの設定ファイルを編集
# Settings → Tools & MCP → Add MCP Server

Cursorの mcp.json に以下を追加:

{
  "mcpServers": {
    "firecrawl": {
      "command": "npx",
      "args": ["-y", "firecrawl-mcp"],
      "env": {
        "FIRECRAWL_API_KEY": "fc-your-api-key-here"
      }
    }
  }
}
# 3. Cursorを再起動して確認
# MCP接続が成功すると、エージェントにFirecrawlツールが追加される

Claude Codeでの設定

# Claude Codeの場合はsettings.jsonに追加
claude mcp add firecrawl -- npx -y firecrawl-mcp

# 環境変数を設定
export FIRECRAWL_API_KEY="fc-your-api-key-here"

Claude Codeの使い方も参考にしてほしい。

Firecrawl APIの使い方 — 実践コード例

基本:1ページをスクレイピング

curl -X POST https://api.firecrawl.dev/v1/scrape \
  -H "Authorization: Bearer $FIRECRAWL_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "url": "https://example.com",
    "formats": ["markdown", "html"],
    "onlyMainContent": true
  }' | jq '.data.markdown'

Python SDKでバッチスクレイピング

from firecrawl import FirecrawlApp

app = FirecrawlApp(api_key="fc-your-api-key")

# 複数URLを一括処理(batch_scrapeを推奨)
urls = [
    "https://docs.example.com/getting-started",
    "https://docs.example.com/api-reference",
    "https://docs.example.com/pricing",
]
results = app.batch_scrape_urls(urls, params={"formats": ["markdown"]})

for result in results["data"]:
    print(f"--- {result['metadata']['title']} ---")
    print(result["markdown"][:500])

MCPでAIエージェントから直接呼び出す

{
  "jsonrpc": "2.0",
  "id": 1,
  "method": "tools/call",
  "params": {
    "name": "firecrawl_scrape",
    "arguments": {
      "url": "https://example.com",
      "formats": ["markdown"],
      "onlyMainContent": true
    }
  }
}

Cursorのコンポーザーで「このサイトを分析して」と指示するだけで、AIが自動的にFirecrawl MCPを呼び出してデータを取得する。

Firecrawlの料金プラン比較

プラン 月額 クレジット/月 同時リクエスト 向いている用途
Free $0 500(生涯) 2 お試し・評価
Hobby $16 3,000 5 個人開発・副業
Standard $83 100,000 50 本格運用・チーム
Growth $333 500,000 100 プロダクション
Enterprise 要問合せ カスタム カスタム 大規模・SLA必要

注意点:

  • 基本は1クレジット=1ページだが、JSON抽出+Enhanced Modeでは1ページ9〜10クレジット消費する場合がある
  • クレジットは月をまたいで繰り越し不可
  • 無料プランの500クレジットは生涯上限(月500ではない)
広告
🔥 Firecrawlを無料で試してみる
500クレジット無料・カード不要。AIエージェントにWeb検索機能を追加しよう
🚀 Firecrawl公式サイトへ

Firecrawl vs Jina Reader vs Crawl4AI — 代替ツール比較

比較項目 Firecrawl Jina Reader Crawl4AI
タイプ SaaS API SaaS API セルフホスト(OSS)
料金 $0〜333/月 トークン従量制 無料(インフラ費別)
MCP対応 ✅ 公式サーバーあり
JS レンダリング ✅(Playwright)
セットアップ APIキーのみ URLプレフィックスのみ Docker環境構築が必要
バッチ処理 ✅ batch_scrape対応 ⚠️ 制限あり
構造化データ抽出 ✅ AIプロンプトで ⚠️ 基本的 ✅ LiteLLM連携
向いている場面 本格運用・MCP連携 プロトタイプ・手軽さ フルコントロール

結論: MCP連携を重視するならFirecrawl一択。手軽に試すならJina Reader。インフラを自前管理したいならCrawl4AIがおすすめ。

Firecrawl MCPの実用ユースケース

1. 競合サイト分析の自動化

# 競合サイトの構造・コンテンツを自動収集
result = app.crawl_url("https://competitor.com", params={
    "limit": 50,
    "scrapeOptions": {"formats": ["markdown"]},
})

# 収集データをLLMに渡して分析
for page in result["data"]:
    print(f"Title: {page['metadata']['title']}")
    print(f"Word count: {len(page['markdown'].split())}")

2. RAGパイプラインのデータソース

ドキュメントサイトを丸ごとクロールし、ベクトルDBに投入するパターン。RAGの基本と組み合わせると強力。

3. SEO技術監査

メタタグ・見出し構造・内部リンクを一括抽出し、技術的なSEO課題を自動検出。

2026年のFirecrawl最新アップデート

  • Sparkモデル: AI抽出専用のSpark 1 Mini(コスト大幅削減)とSpark 1 Pro(複雑なマルチドメインリサーチ)をリリース
  • 検索コスト大幅削減: Search機能の料金が大幅引き下げ
  • Excel対応: .xlsxファイルからのデータ抽出に対応
  • 同時実行制御: crawlとbatch_scrapeでリクエスト単位の最大同時実行数を指定可能に

参照ソース


この記事はAI業界の最新動向を速報でお届けする「AI Heartland ニュース」です。