アクセシビリティメニュー コンテンツにスキップ
day1

MCP Launch Week Day 1

1 分読

MCPローンチウィーク 1日目

本日より、Web MCPローンチウィークを開始します。エージェントワークフローにおける最大のボトルネック「コンテキスト汚染」を解決する新機能「ツールグループ」をMCPサーバーにリリースします

MCPサーバーのスコープを必要ツールのみに限定できるようになりました(例:?groups=social または?groups=ecommerce)。これによりトークン使用量を大幅に削減し、エージェントの精度を向上させます。

問題点:「全ツール」トラップ

MCPの初期段階(つまり3ヶ月前)では、APIが提供する全機能をツールとして公開するという単純なパターンが標準でした。

Bright Dataにとってこれは問題です。当社のネットワークはAmazon、LinkedIn、TikTok、Google Maps、Zillow、金融データ、ブラウザ自動化の生データといったデータセットを提供しています。もし全てのデータセットとスクレイパーをサーバーに読み込んだら、200以上の異なるツールを公開することになります。

MCPクライアント(Claude DesktopやCursorなど)がサーバーに接続すると、これらのツール定義(名称、説明、JSONスキーマ)が全てシステムプロンプトにダンプされます。

これにより2つの重大な問題が発生します:

  1. コンテキスト汚染:LLMは不要な45のツールに気を取られます。Amazonのスクレイピング中にInstagramツールのパラメータを幻覚表示する可能性があります。
  2. トークン非効率性:ユーザーが「Hello」と入力する前から、ツール定義のために数千の入力トークンを消費しています。

解決策:スコープ付きツールグループ

MCPサーバーをモジュール式のツールグループに対応するよう再構築しました。単一サーバーではなく、組み合わせて機能を提供するセットとして扱えるようになりました。

データセットを論理ドメイン別に整理しました:

  • ECOMMERCE: Amazon、Walmart、eBay、Google Shopping
  • ソーシャルメディア: TikTok、Instagram、Facebook、Reddit、X(Twitter)
  • BUSINESS: LinkedIn、Crunchbase、Google Maps、Zillow
  • RESEARCH: GitHubリポジトリ、ロイターニュース、学術情報源
  • 金融: 株価データ、市場動向、金融ニュース
  • アプリストア: iOS App Store、Google Play
  • ブラウザー: スクレイピングブラウザのフルオートメーションスイート
  • 高度なスクレイピング: バッチ処理と高スループットユーティリティ

仕組み

内部では、初期化リクエストをインターセプトするフィルターロジックを実装しています。クライアントを設定する際、必要なグループをURLに追加するだけです。

Eコマースエージェントの場合:

https://mcp.brightdata.com/mcp?token=<YOUR-API-token>&groups=ecommerce
# またはSTDIO環境変数経由
GROUPS=ecommerce

ソーシャルメディアアナリストエージェントの場合:

https://mcp.brightdata.com/mcp?token=<YOUR-API-token>&groups=social

デフォルトでは全員に基本ツール(search_enginescrape_as_markdown)が提供されます。サーバーは動的にツールリストを構築します:

// server.jsからの簡略化ロジック
function build_allowed_tools(groups = [], tools = []) {
    const allowed = new Set(base_tools);
    for (let groupId of groups) {
    const group = GROUPS[groupId];
    if (group) {
        // このグループ固有のツールのみ追加
        group.tools.forEach(t => allowed.add(t));
    }
}
return allowed;
}

「コード実行」という未来と「ツール」という現在

なぜこれが今、これほど重要なのか?

業界では大きな変革が起きている。AnthropicやCloudflareの最近の論文やデモは、「コード実行」と「コンピューター利用」への移行を強調している。そのビジョンとは、get_amazon_review(asin: "123")を呼び出す代わりに、モデルがPythonスクリプトを記述したりbashコマンドを実行したりして、自らデータを取得するというものだ。

私たちはこの未来を強く信じています。これによりモデルは創造的になり、硬直したAPIスキーマに縛られることがなくなります。

しかし現時点では未到達です。

現在のMCPクライアントの大半は依然として厳密にツール中心です。モデルが実行可能なすべてのアクションをサーバーが明示的に定義することに依存しています。コンテキストウィンドウに100のデータセットを投入すると、モデルの性能は低下します。

ツールグループは架け橋となる存在です。現行世代のAIエージェントを圧倒することなく、Bright Dataの膨大なデータインフラの力を提供します。これによりコンテキストウィンドウをクリーンに保ち、エージェントの推論能力を鋭く維持できるのです。

パフォーマンスへの影響

ツールグループを活用することで、エージェントの信頼性が大幅に向上しました

トークン消費量の比較

以下は、特定のツールグループを使用した場合と全ツールをロードした場合(62ツールで7,358トークンのProdモード)のトークン使用量の劇的な削減を示す比較です:

主な知見:

  • 全ツールグループで78.5%~94.6%のトークン削減(全62ツール読み込み時と比較)
  • 財務グループと旅行グループが94.6%削減(401トークン vs 7,358トークン)で最高の最適化効果を示しました
  • ソーシャルメディアグループはツールスキーマが複雑なため2,823トークンと使用量が最大だが、それでも61.6%削減
  • パラメータ選択の成功率向上(モデルがlinkedin_urlfacebook_url を混同する可能性が低減)
  • 初期ハンドシェイクのレイテンシ低減

ぜひお試しください

Web MCPサーバーはオープンソースで、今すぐ利用可能です。

  • はじめに: ドキュメントを確認して、最初のエージェントを設定してください。
  • 無料プラン:基本ツール(search_enginescrape_as_markdown)で月間5,000リクエストを無料で利用できます。

開発をお楽しみください。

開始の準備はできていますか?
Web MCPサーバーを探索し、強力なAIエージェントを構築し始めましょう。
ドキュメントを読む リポジトリを表示