AI

Bright DataのBrowser APIとVercelのAgent Browser:AIエージェントにとってインフラが重要な理由

Bright Data Browser APIとVercel Agent Browserが、インフラストラクチャやボット対策機能においてどのように異なり、AIエージェント向けにそれぞれをいつ使用すべきかについて学びましょう。
2 分読
Bright Data's Browser API vs Vercel Agent Browser blog image

この記事では以下を学びます:

  • Bright Data Browser APIとVercel Agent Browserの定義、およびアーキテクチャ上の相違点
  • エージェント型ブラウザの性能においてインフラが重要な役割を果たす理由
  • 各ソリューションがアンチボットシステム、CAPTCHA、IPブロックをどのように処理するか
  • スケーリング、価格設定、AI統合における主な差異
  • 具体的なユースケースに応じた各ツールの適切な使用タイミング

さあ、詳しく見ていきましょう!

Bright Data Browser API

BrowserAPI-landing-page

Bright DataのBrowser API別名Agent Browser)は、エンタープライズグレードのプロキシインフラストラクチャ上に構築されたクラウドホスト型ブラウザソリューションです。標準的なChrome DevTools Protocol(CDP)経由でアクセス可能な、Bright Dataの管理サーバー上で動作する実際のGUI Chromiumブラウザを実行します。

複雑に聞こえるかもしれませんが、本質的にBright Dataのスクレイピングブラウザが提供するものは以下の通りです:

  • 195カ国にまたがる住宅用、データセンター・プロキシ、モバイルプロキシ、ISPネットワークから1億5000万以上のローテーションプロキシを提供。価格比較テストでは都市レベルのジオロケーションをターゲットに設定し、手動でプロキシを設定する必要はありませんでした。
  • reCAPTCHA v2/v3、hCaptcha、Cloudflare Turnstile、DataDome、PerimeterX、AWS WAF、GeeTestに対応した自動CAPTCHAの解決機能。3ヶ月のテスト期間中、CAPTCHA処理用のコードを1行も記述する必要がありませんでした。
  • キャンバス、WebGL、オーディオコンテキスト、フォント、デバイス列挙を網羅した完全なフィンガープリント管理。標準のPlaywrightでは頻繁に発生していた「自動化検出」エラーが完全に解消されました。
  • 実際のブラウザ署名に一致するTLSフィンガープリントローテーション。これにより、ページに到達する前のネットワークレベルでリクエストが失敗するという、これまで診断すらできなかったブロックが解決されました。

設定は5分で完了。ローカルブラウザ接続をBright DataのWebSocketエンドポイントに切り替えるだけで、他は全てそのまま。Puppeteer、Playwright、Seleniumのコードも変更不要。

CAPTCHAについては、システムに自動解決させる(デフォルト設定)か、明示的な制御が必要な場合に検出イベントを監視するかを選択可能。ほとんどの場合、スクリプトが継続する前にサーバー側で解決されるため、CAPTCHA処理が行われていることすら気づかない。

Vercel Agent Browser

agent-browser-github-page

VercelがAgent Browserを開発した背景には、多くの開発者が直面する特定の問題がありました。AIエージェントがブラウザ状態を処理する際のコンテキストウィンドウの肥大化です。

標準のPlaywrightは数千ノードを含む完全なアクセシビリティツリーを返します。Claude経由でブラウザ自動化を実行した際、単一ページのスナップショットだけで15,000トークン以上を消費しました。複雑なワークフローではタスク完了前にコンテキストウィンドウが枯渇していました。

Agent Browserのスナップショット+参照システムは、同じページを約1,400トークンに圧縮します。クラス、ID、ARIAラベル、ネスト構造を含む冗長なHTMLではなく、以下のような形式で取得できます:

- ボタン "Sign In" [ref=e1]
- テキストボックス "Email" [ref=e2]
- テキストボックス "Password" [ref=e3]

その後、エージェントに@e1をクリックするか@e2を入力するよう指示します。この93%の削減により、トークン制限に達する前に5~6倍のブラウザ操作が可能になります。ある独立ベンチマークでは、6つのブラウザテストでPlaywright MCPは約31,000文字(約7,800トークン)を消費したのに対し、Agent Browserでは約5,500文字(約1,400トークン)のみ。同じコンテキスト予算内で5.7倍のテストサイクルを実行可能。

このツールはPlaywrightをラップしたRust CLIです。起動時間は50ms未満、基本操作から動画録画まで108以上のコマンドをサポートし、Claude CodeやCursorなどCLI実行AIエージェントと直接連携します。生成コードを反復する開発ワークフローでは、コンテキスト効率が真に重要です。

主なトレードオフ:インフラが不要。Agent Browserはローカルで動作し、私のIPを使用、navigator.webdriverを公開、CAPTCHAの解決やフィンガープリント管理は一切行わない。保護されたサイトでは、-pフラグで外部プロバイダーを導入する必要があり、コストと複雑さが加わり「軽量」という利点が失われる。

Bright Dataスクレイピングのテスト

比較記事であるため、両ツールでいくつかのテストを実施しました。

最初のテスト:Cloudflare保護サイト

両ツールをCloudflare保護のECサイトに向けました。単純なタスク:商品価格の抽出。

Vercel Agent Browser:初回は成功したが、複数回の試行では概ね失敗。Agent BrowserはCloudflare保護サイトに対して信頼性のある動作をしない。成功率は保護レベルに依存する:

Cloudflare設定 Agent Browserは動作するか?
Cloudflareなし はい
基本(低セキュリティ) おそらく
ボット戦闘モード いいえ
ターンスタイルCAPTCHA いいえ

Bright Data Browser API:3秒でページを読み込みました。CAPTCHAもチャレンジも不要。レジデンシャルIPローテーションとフィンガープリント管理がすべてを自動処理。この3秒の差こそが、テスト中ずっと直面した中核インフラの差を象徴しています。

Cloudflare設定 Bright Dataは機能するか?
Cloudflareなし はい
ベーシック(低セキュリティ) はい
ボット対策モード はい
ターンスタイル CAPTCHA はい

ここでの違いは明白です:Bright Dataのプロキシインフラはネットワークレベルでアンチボット対策を実現しますが、Agent Browserはそもそもそれらに対処するよう設計されていません。

これは、独立したベンチマークとも一致しています。Bright Data は、Proxyway のテストで 7 つの難易度の高いドメインにおいて 98.44% の平均成功率を達成し、テスト対象のプロバイダの中で最高の結果となりました。Indeed、Zillow、Capterra、Google などの特定のターゲットでは 100% の成功率を達成し、Amazon では 98%、Google ショッピングでは 97% の成功率を達成しました。

2 つ目のテスト:協力的なサイトにおけるトークンの効率性

公平な比較を行うため、Agent Browser が優位性を持つ、保護されていない協力的なサイトについてもテストを行いました。ボット保護のない標準的なドキュメントサイトでは、Agent Browser のスナップショットシステムにより、Playwright の生のアクセシビリティツリーが生成するページの約 10% までページが圧縮されました。

具体的には、標準的な Playwright では 7,000 から 8,000 トークンを消費する典型的なページが、Agent Browser の ref システムでは数百トークンに収まりました。複数のステップからなるワークフロー(ドキュメントのナビゲート、コードサンプルの抽出、出力の検証)では、これは 1 つのコンテキストウィンドウ内でセッション全体を完了でき、制限に達する前に 5 から 6 倍多くの操作を実行できることを意味しました。

Bright DataのBrowser APIでは同じデータを取得できたものの、生のページ出力は著しく多くのトークンを消費しました。Bright DataはLLMのコンテキストウィンドウ最適化を前提に設計されておらず、その差がここでも明らかになりました。ボトルネックがサイトアクセスではなくトークン予算にある場合、Agent Browserの方が優れたツールです。

第三のテスト:AI統合

両ツールとも最新のAIスタックと連携しますが、その方法は異なります。

Bright Dataはbrowser-use、LangChain、LlamaIndexと直接連携します。標準設定は以下の通りです:

from browser_use import Agent
from browser_use.browser.browser import Browser, BrowserConfig
from langchain_openai import ChatOpenAI

browser = Browser(
    config=BrowserConfig(
        cdp_url="wss://brd-customer-XXX-ゾーン-YYY:[email protected]:9222"
    )
)

agent = Agent(
    task="Extract all product prices from the homepage",
    llm=ChatOpenAI(model="gpt-4o"),
    browser=browser
)

Vercel Agent BrowserはCLI実行を通じて動作します。AIがbashコマンドを直接実行するClaude CodeやCursorに最適です:

npx skills add vercel-labs/agent-browser

その後、Claudeはagent-browser navigateや agent-browser click @refなどを実行できます。このコンテキスト効率は、長時間のコーディングセッションにおいて非常に役立ちます。

最終テスト:スケーリング

Browser APIでは、スケーリングはほぼ抽象化されています。テスト用の5つの同時セッションでも、本番クロール用の2,000セッションでも、接続文字列は同じです。ロードバランシング、セッション回復、地理的分散はすべてBright Data側で処理されます。

インフラは無限の同時ブラウザセッションをサポートし、99.99%のネットワーク稼働率を維持、プラットフォーム全体で1日20億件以上のリクエストを処理します。平均応答時間はレジデンシャルプロキシで約0.7秒、データセンター・プロキシで約0.24秒です。

Agent Browserのスケーリングはお客様の責任となります。サーバーレスデプロイでは、軽量版Chromiumパッケージ(フル版684MBに対し50MB)を使用し、Vercel Fluid Computeを設定することでコールドスタートを最小化できます。複数の分離セッションは--sessionフラグで実行します。

これは中程度のワークロードや開発用途には有効です。しかし、数百の同時セッションを超えるスケールでは、Bright Dataがデフォルトで処理するリトライロジック、セッション分離、地理的分散の管理が必要になります。高負荷の本番ワークロードでは、こうした運用オーバーヘッドが累積します。

料金体系

pricing

Browser APIは帯域幅で課金されます:

プラン 月額費用 データ量 実効 $/GB
従量課金 0ドル 0 8.00ドル
成長 499ドル 71 GB 約7.00ドル
ビジネス 999ドル 158 GB 約6.00ドル
規模 1,999ドル 400 GB 約5.00ドル

Agent BrowserはApache 2.0ライセンスのもとで無料です。CLI本体自体には一切費用がかかりません。

ただし、保護されたサイトを利用する場合、外部サービスの追加が必要になる可能性があります。具体的な例としては以下のような構成が考えられます:

  • Browserbase(クラウドブラウザ用、ボット対策付き):約150ドル/月
  • BrowserbaseでCAPTCHAの解決ができない2Captcha:約47ドル/月
  • 依然としてブロックされるサイト向けレジデンシャルプロキシアドオン:約120ドル/月

合計月額約317ドルに加え、3つの別サービスをつなぎ合わせる統合作業と、障害発生時の3つのダッシュボードをまたいだデバッグ作業が発生します。

保護されていないサイトでの開発ワークフローには、Agent Browserが実質無料で利用可能です。保護されたサイトへの本番環境アクセスにおいては、Bright Dataのバンドル型インフラストラクチャが、個別プロバイダーから同等のスタックを構築するよりも安価になる場合があります。

インフラストラクチャの格差

両ツールを徹底的にテストした結果、インフラがウェブアクセス型AIエージェントの成功率を決定すると結論づけました。

実のところ、Vercelは優れたコンテキスト最適化ツールを構築しました。協力的なサイトでの開発ワークフローでは日常的に使用可能です。しかし重大な制限として、Agent Browserには組み込みのボット対策機能が存在しません。標準Chromiumを使用したローカル環境またはサーバーレス環境で動作するため、以下の問題が生じます:

  • プロキシローテーション不可(IPがブロックされる)
  • CAPTCHAの解決不可(手動介入が必要)
  • フィンガープリント管理不可(navigator.webdriverで検出される)
  • TLSフィンガープリント最適化不可(ネットワークレベルでブロックされる)

保護されたウェブサイトにアクセスするには、-pフラグを介してBrowserbase、Browser Use、Kernelなどの外部サービスを統合する必要があります。これにより複雑性、コスト、潜在的な障害点が追加されます。

Bright DataはWebアクセス基盤を構築しました。本番環境のエージェントが実際のWebサイトにアクセスする場合、1億5000万IPネットワーク、自動CAPTCHAの解決、フィンガープリント管理は機能ではなく必須要件です。

「無料 vs 有料」という枠組みでは本質を見失います。真の問いは「エージェントがアクセスする必要がある対象」と「必要な成功率」です。保護されたサイトを大規模に扱う場合、本番ワークロードを運用するチームは常に、ソリューションを寄せ集めることが節約効果よりもコストと複雑さを増大させることに気づきます。Bright Dataのバンドル型インフラはコストが高く、より多くの価値を提供します。

両ソリューションの比較

主要な側面における両ソリューションの比較は以下の通りです:

項目 Bright Data Browser API Vercel Agent Browser
主な焦点 ボット回避対策とウェブアクセス AIエージェントのコンテキスト効率化
インフラストラクチャ 1億5000万以上のIPアドレスを備えたマネージドクラウド ローカルまたはサーバーレス(BYOD)
プロキシネットワーク 組み込み、195カ国 なし(外部プロバイダーが必要)
CAPTCHAの解決 自動、8種類以上対応 非内蔵
指紋管理 完全なブラウザ署名制御 なし(検出可能)
コンテキスト効率 標準(フルページ状態) スナップショット+リファレンスによる93%削減
価格 $5-8/GB 帯域幅 無料(Apache 2.0 ライセンス)
スケーリング 同時セッション数無制限 ローカル/サーバーレスリソースによる制限あり
AI統合 LangChain、LlamaIndex、MCP Server CLIベース(Claude Code、Cursorなど)

結論

Bright Data Browser APIとVercel Agent Browserは、同じ問題の異なる層に対応して構築されています:AIエージェントに信頼性が高く効率的なWebアクセスを提供することです。

エージェントが協力的なサイトで動作し、トークン効率がボトルネックとなる場合、Vercel Agent Browserが最適な選択肢です。93%のコンテキスト削減率と50ms未満の起動時間を実現し、開発ワークフロー、コーディングアシスタント、自己検証型エージェントにとって真に有用なツールとなります。このユースケースにおいては、他に類を見ない性能を発揮します。

しかし開発環境と本番環境は異なります。エージェントが保護された実サイトを大規模にアクセスする必要がある場合、議論はトークン予算から成功率へと移行します。Bright Data Browser APIは、困難なドメインでも98%以上の成功率、8種類以上の自動CAPTCHAの解決、195カ国1億5000万以上のIPによる無制限同時セッションを実現します。このインフラは本番エージェントにとって必須です。それが稼働基盤そのものなのです。

オープンウェブ上で確実に動作するAIエージェントを構築するチームにとって、Bright Data Browser APIはその基盤をすぐに提供します。

関連資料