このガイドでは、Bright DataのWeb MCPをChatGPT Atlasに5分以内で接続し、実際のウェブデータで動作するAIワークフローの構築を開始する方法を学びます。
AIエージェントとウェブデータの問題点
AIエージェントは推論、文章作成、分析に優れていますが、ウェブから最新のデータを取得するのは苦手です。理由は以下の通りです:
- ブロックされる:ほとんどのウェブサイトはボット検知を使用しています。標準的なAIツールはCloudflare、CAPTCHA、レート制限を突破できません。
- 複雑なサイトのパース不能:動的JavaScriptアプリ、無限スクロール、遅延読み込みは従来のスクレイパーを機能停止させる。
- 構造解析に時間を浪費:商品価格などの抽出に何時間もコードを書く羽目になり、データ活用に充てる時間が失われる。
- 古いデータしか扱えない:ChatGPTのトレーニングデータには有効期限があります。リアルタイムアクセスがなければ、エージェントは手探り状態です。
Bright DataのWeb MCPサーバーはこれら全てを解決します。実戦で実証済みのインフラ(フォーチュン500企業が利用)をシンプルなMCPコネクターとしてパッケージ化し、ChatGPT Atlasと箱から出してすぐに連携します。
Bright DataのWeb MCPが他と異なる点:
1.ブロックされない
195ヶ国以上をカバーするBright Dataのグローバルレジデンシャルプロキシネットワークを基盤としています。リクエストは実際のユーザーからのもののように見えます。AWS、Google Cloud、その他すべてのデータセンターIP範囲をブロックするサイトでも動作します。
2.60以上のプラットフォームに対応済み
LinkedInのスクレイピングに時間を浪費する必要はありません。専用エクストラクタが用意されています。Amazon、Instagram、TikTok、Facebook、Google Maps、YouTube、Reddit、Zillow、Booking.comなど50以上のプラットフォームも同様です。煩雑なHTMLではなく構造化されたJSONを取得できます。
3.完全なブラウザ自動化
単なるHTTPリクエストではなく、ボタンクリック、フォーム入力、ページスクロール、JavaScript多用サイトの処理が可能な実Chromeブラウザを運用。スクリーンショット撮影、要素待機、ネットワークトラフィック抽出も対応。
4.無料で始められる
月間5,000リクエストを永久に無料で利用可能。クレジットカード不要。本格的なテストや日常的な使用に十分な容量です。
5.2モードシステム
- ラピッドモード(無料):高速スクレイピング、検索結果、マークダウン変換
- プロモード:上記機能+60以上のプラットフォーム用抽出ツール+完全なブラウザ自動化
競合他社のWeb MCPサーバーはどちらか一方しか提供しません。Bright Dataは両方を提供します。
ChatGPT AtlasでのBright Data MCP設定
必要なもの
- ChatGPTアカウント(どのプランでも可)
- Bright Dataアカウント
- 2分間の時間
設定手順(本当に簡単です)
ステップ1: 認証情報を取得する
Bright Dataに登録後、メールでAPIトークンが届きます。見つからない場合はアカウント設定から取得してください。例:2dceb1aa0123456789abcdef
ステップ2:接続URLを作成
Web MCPサーバーのエンドポイントは以下です:
https://mcp.brightdata.com/sse?token=YOUR_API_TOKEN
YOUR_API_TOKEN を実際のトークンに置き換えてください。
高度な機能(プラットフォーム抽出ツール+ブラウザ自動化)をご希望ですか?&pro=1 を追加してください:
https://mcp.brightdata.com/sse?token=YOUR_API_TOKEN&pro=1
ステップ3: ChatGPTに接続する
- ChatGPTの設定を開く(プロフィール画像をクリック)
- 「アプリとコネクタ」→「詳細設定」へ移動
- 開発者モードを有効にする
- 「作成」をクリック(新しいコネクタを追加するため)
- 以下を入力:
- 名前: “Bright Data”(任意の名前)
- 説明: 「リアルタイムWebデータおよびスクレイピングインフラ」
- URL: ステップ2で取得したエンドポイントを貼り付け
- 作成をクリックし、接続を承認
ステップ4: Atlasを開いてテスト
ChatGPT内のAtlasブラウザアイコンをクリック。以下を試す:
「Googleで’best mechanical keyboards 2025’を検索し、価格付きのトップ5結果を表示して」
ChatGPTがBright Dataを利用してリアルタイム検索結果を取得し、データを抽出する様子を確認してください。ブロックもエラーもなく、結果のみが表示されます。
今日から構築できる実際のワークフロー
ワークフロー1:競合情報ダッシュボード
シナリオ:Amazon、eBay、Walmartで競合他社の価格を追跡しています。
プロンプト:
以下の商品URLの価格変動を監視:
- [Amazon URL]
- [eBay URL]
- [Walmart URL]
毎日チェックし、価格が10%以上下落した場合は通知してください。
動作内容:ChatGPTはweb_data_amazon_product、web_data_ebay_product、web_data_walmart_productを使用して現在の価格を抽出します。HTMLパース不要、サイト更新時のセレクター破損も発生しません。
ワークフロー2: LinkedInリードジェネレーション
シナリオ:フィンテック分野のシリーズAスタートアップ企業の意思決定者が必要。
プロンプト:
LinkedInで以下の条件に合致する企業を検索:
- 業界:金融サービス
- 資金調達段階:シリーズA
- 所在地:サンフランシスコ
各企業から以下を抽出:
- 企業名と従業員数
- 最近の求人情報(特にCレベル役職)
- 創業者および副社長の従業員プロフィール
動作内容:ChatGPTがweb_data_linkedin_company_profile、web_data_linkedin_job_listings、web_data_linkedin_people_searchを連携しリードリストを構築。データを自動的にスプレッドシートに構造化。
ワークフロー3: ソーシャルメディア感情分析
シナリオ:製品をローンチし、ソーシャルメディア上の話題性を追跡したい。
プロンプト:
過去24時間以内に「製品名」が言及されたX(Twitter)とRedditを検索。
投稿内容、エンゲージメント指標、感情を抽出。
要約レポートを作成。
動作内容: ChatGPTは web_data_x_postsとweb_data_reddit_postsで言及を収集し、内蔵推論機能で感情分析を実施。全て単一ワークフローで完結。
ワークフロー4: 動的フォーム入力
シナリオ:ログインと複数ステップのフォームが必要なWebポータルにデータを送信する必要がある。
プロンプト:
[ポータルURL]にアクセスし、[認証情報]でログイン後、提出フォームに移動し、
以下のフィールドに[データ]を入力して送信してください。各ステップでスクリーンショットを撮影。
動作内容: ChatGPTはscraping_browser_*ツールを使用して:
scraping_browser_navigateでサイトを開くscraping_browser_type_refでログインフォームを入力scraping_browser_click_refで手順をクリックscraping_browser_screenshotでプロセスを記録
SeleniumスクリプトもPuppeteerコードも不要。自然な言語だけで実現します。
内部の仕組みを理解する
Bright Data MCPに接続すると、3つのカテゴリーにまたがる60以上の専門ツールにアクセスできます:
汎用ウェブスクレイピング(Rapidモード – 無料)
search_engine– Google、Bing、Yandex検索結果scrape_as_markdown– 任意のウェブページ → クリーンなテキストscrape_as_html– ブロック解除済み生のHTMLscrape_batch– 最大10URL同時処理search_engine_batch– 最大10件の検索を並列実行extract– あらゆるページからのAIによるデータ抽出session_stats– ツール使用状況を追跡
プラットフォーム固有の抽出ツール(Proモード)
49種類の専門ツール:
- Eコマース:Amazon(商品、レビュー、検索)、eBay、Walmart(商品、出品者)、Best Buy、Etsy、Zara、Home Depot
- ソーシャルメディア:Instagram(プロフィール、投稿、リール、コメント)、TikTok(プロフィール、投稿、ショップ、コメント)、Facebook(投稿、マーケットプレイス、レビュー、イベント)、X/Twitter、Reddit、YouTube(動画、プロフィール、コメント)
- プロフェッショナルネットワーク:LinkedIn(個人プロフィール、企業プロフィール、求人情報、投稿、人物検索)
- 不動産:Zillow物件リスト
- 旅行:Booking.comのホテル、Googleマップのレビュー
- ビジネスデータ:Crunchbase企業情報、ZoomInfoプロフィール、Yahoo Finance
- アプリストア:Google Playストア、Apple App Store
- ショッピング:Googleショッピング
- ニュース:ロイターの記事
- 開発者ツール:GitHubリポジトリファイル
ブラウザ自動化(プロモード)
13の強力な自動化ツール:
- ページ移動(進む/戻る)
- 参照による要素クリック
- フォーム入力とテキスト入力
- スクリーンショットの取得(全ページまたはビューポート)
- スクロールと要素待機
- ネットワークリクエストを監視
- ページのHTMLまたはテキストを抽出
- アクセシビリティのためのARIAスナップショットをキャプチャ
各ツールのドキュメントと使用例はdocs.brightdata.com/mcp-server/tools に記載されています。
費用と制限:実際に支払う金額
無料プラン(Rapidモード)
- 月間5,000リクエスト– 毎月リセット
- 一般的なスクレイピングツールのみ(7ツール)
- 最適な用途:調査、コンテンツ収集、SERP分析
- クレジットカード不要
プロモード
- 無料プラン終了後は従量課金制
- 60以上のプラットフォーム抽出ツールとブラウザ自動化機能へのアクセス
- ツールごとに料金が異なります(通常、リクエストあたり0.001~0.01ドル)
- ダッシュボードで利用状況を監視
プロのコツ:まずはRapidモードから始めましょう。プラットフォーム抽出ツールやブラウザ自動化が必要な場合にのみProモードへアップグレードしてください。ほとんどのユースケースは無料プランで十分機能します。
デバッグと監視
MCP接続を通じて発生するすべての操作は、Bright Dataダッシュボードに記録されます:
確認可能な内容:
- リアルタイムリクエストログ(URL、ステータス、応答時間)
- ツール使用状況の内訳(最も呼び出されているツール)
- エラー追跡(ブロックされたリクエスト、タイムアウト、APIエラー)
- コスト追跡(使用量と費用)
- レート制限の監視
よくある問題:
- 「ツールが見つかりません」→ RapidモードでProツールを使用しています。URLに
&pro=1を追加してください。 - 「レート制限超過」→ 月間クォータに達しています。アップグレードするか、リセットされるまでお待ちください。
- 「無効なトークン」→設定でAPIトークンを確認してください。
さらに活用するには
基本操作に慣れたら、以下のリソースを活用してください:
- GitHubリポジトリ– ソースコード、課題、貢献
- ライブプレイグラウンド– コードを書かずにツールをテスト
- コミュニティの事例– 他の開発者による実際のプロジェクト
- その他のMCPクライアント– Claude、Cursor、VS Code、LangChain、n8nなどでのBright Data活用例
なぜこれが重要なのか
AIエージェントが単なる会話だけでなく「行動」を起こす新時代が到来しています。しかし「行動」には現実世界のデータへのアクセスが不可欠であり、その大半はウェブ上に存在します。
Bright DataのWeb MCPサーバーは、この標準を実装した最も強力なソリューションの一つです。なぜなら、単にAIをウェブに接続するだけでなく、自動化を阻むあらゆる障壁(ブロック、CAPTCHA、レート制限、複雑なサイト構造、動的コンテンツ)を取り除くからです。
その結果?デモだけでなく本番環境でも実際に機能するAIワークフローが実現します。
準備はできましたか?Bright Dataに登録し、APIトークンを取得してChatGPT Atlasに接続してください。最初の5,000リクエストは無料です。
ご質問は? FAQを確認するか、サポートまで お問い合わせください。