AI

Nexla ExpressとBright DataのWeb MCPで自動化されたウェブデータパイプラインを構築する

Bright DataのWeb MCPがNexla Expressを強化し、コーディング不要でウェブデータ収集を自動化し、強力なデータパイプラインを構築する方法をご紹介します。
2 分読
Nexla Express with Bright Data

この記事では、以下の内容を解説します:

  • Nexla Expressとは何か、何を提供するか。
  • Bright DataのWeb MCPを接続することでより強力になる理由。
  • Bright DataのWeb MCPをExpressに統合してウェブデータパイプラインを構築する方法。

さっそく始めましょう!

Nexla Expressとは?

Nexla Express

Nexla Express(単にExpressとも呼ばれます)は、エンタープライズ向けのエージェント型データ統合プラットフォームです。コードを書いたりインフラを管理したりする代わりに、平易な英語でデータパイプラインを記述して構築できます。

ExpressはAPI、データベース、ファイルに接続し、インジェスト、変換、デプロイを自動的に処理します。ETLスクリプト、スキーママッピング、インフラ管理が不要になります。

主なユースケースとして、分析パイプラインの構築、システム間のデータ同期、レポート用データセットの準備などが挙げられます。データ基盤の維持ではなく、製品開発、インサイト、ビジネス上の意思決定に集中しながら、より速く成果を出し、エンジニアリングのオーバーヘッドを削減できます。

Web MCP機能でExpressを拡張する理由は?

多くのビジネスプロセスは、内部データベースやデータウェアハウスシステムには存在しない情報に依存しています。最新ニュース、市場シグナル、競合他社の価格データなどがその例です。このデータは公開ウェブから得られ、分析と意思決定において重要な役割を果たします。

これにより、2つの主要な課題が生じます:

  • ライブ外部データへのアクセスの制限:従来のデータパイプラインは主に内部ソースで動作し、新鮮なウェブ情報への直接アクセスが欠けていることが多い。
  • 大規模なウェブデータ収集の困難さ:現代のウェブサイトはアンチボット対策、動的コンテンツ、複雑なブラウザ操作を使用しており、信頼性の高いウェブデータ収集が難しい。

これらの制限は、Expressを外部機能で拡張することで克服できます。そのためにプラットフォームはMCP統合をサポートしています。

例えば、Bright Data Web MCPを統合することで、Expressはライブウェブ検索、ウェブサイト探索、ウェブスクレイピング、ブラウザ自動化機能にアクセスできるようになります。これにより、パイプラインがエンタープライズデータとウェブからのリアルタイム情報を組み合わせられます。

Web MCPはウェブデータ収集、探索、自動化のための70以上のツールを提供します。Nexla Expressに接続されると、これらのツールは会話内で利用可能になり、生成されたパイプラインに組み込むことができます。

これらすべてのツールは、195カ国をカバーするBright Dataの4億以上のレジデンシャルIPのグローバルネットワーク上で動作します。このインフラはエンタープライズ規模のワークロードを処理し、99.95%の成功率、99.99%の稼働時間、無制限のスケーラビリティを実現するよう設計されています。

Bright Data Web MCPをExpressに接続してウェブデータパイプラインを構築する方法

このセクションでは、Bright DataのWeb MCPがExpressにエンタープライズ対応のスケーラブルなウェブデータパイプラインを構築する能力をどのように与えるかを説明します。

以下の手順に従ってください!

前提条件

次のステップに進む前に、以下を準備してください:

厳密には必須ではありませんが、例をより現実的にするためにSnowflakeデータベースも接続します。なお、他のExpressがサポートするデータソースも使用できます。

具体的には、SnowflakeでBright Dataが無料提供している「AI Training Dataset from Wikipedia」データセットを使用します。これをウェブデータパイプラインの主要ソースとなる内部ナレッジベースとして扱います。

The

MCPの仕組みWeb MCPサーバーが提供するツールを理解しておくと役立ちます。

ステップ#1:Web MCPを開始する

Airiaエージェントを作成する前に、AiriaがリモートWeb MCPサーバーにアクセスするために使用する接続URLを取得します。

注意:Bright Data Web MCPリモートサーバーはエンタープライズシナリオ向けに設計されています。他のすべてのBright Dataサービスと同様に、無制限のスケーラビリティと同時接続をサポートします。

まず、標準のWeb MCPリモート接続URL形式を確認してください:

https://mcp.brightdata.com/mcp?token=<YOUR_BRIGHT_DATA_API_KEY>&pro=1

<YOUR_BRIGHT_DATA_API_KEY>を実際のBright Data APIキーに置き換えてください。tokenパラメータはリクエストを認証し、Bright Dataアカウントにリンクします。URL内の&pro=1パラメータはオプションです:

  • &pro=1なし:Rapidモードの無料ツールのみにアクセスできます(月最大5,000リクエスト)。
  • &pro=1あり:70以上のツールの完全なカタログと高度な機能にアクセスできます。Bright Dataの標準利用料金が適用されます。

特定のツールやツールグループのみを有効にするなど、より細かい制御が必要な場合は、Bright Dataダッシュボードから直接カスタムMCP接続URLを生成できます。

Bright Dataアカウントにログインし、「AI Gateways > MCP」ページに移動します。セットアップウィザードに従ってMCPサーバーを設定し、カスタムWeb MCP接続URLを生成します:

Note the configured Web MCP connection URL

生成された「Streamable HTTP」接続URLをコピーするか、上記の形式を使用して構築してください。次のステップでBright Data Web MCPをExpressパイプラインに接続する際に使用します。お疲れ様でした!

ステップ#2:Nexla ExpressにWeb MCP接続を追加する

Expressにログインし、左側のメニューから「Explore MCPs」を選択します。「MCP STORE」ページで「Add Custom MCP」ボタンをクリックします:

Clicking the

次に、「Add MCP Server」フォームに記入し、Web MCP接続URLを「SERVER URL」フィールドに貼り付けます:

Filling out the

「Connect」をクリックすると、ExpressがBright Data Web MCPサーバーへの接続を確立します。完了です!

ステップ#3:統合が機能していることを確認する

Nexla ExpressがWeb MCPサーバーに接続し、70以上のツール(pro=1パラメータを省略した場合はRapidモードの限定サブセット)にアクセスできるようになったことが確認できます:

Note the 74+ available tools

ツールがNexla Expressの会話エージェントで実際に利用可能かどうかを確認するには、左メニューから「New Chat」をクリックします:

Reaching the

次に、「Add MCP」アイコンをクリックし、「mcp.brightdata.com」オプションを選択してMCPを接続します:

Adding the Web MCP server to the chat

次のようなプロンプトを実行します:

Which Bright Data Web MCP tools do you have access to?

応答には利用可能なすべてのツールと、それぞれの説明が一覧表示されます:

Note the tool descriptions returned by the prompt

これにより、Expressがリモートサーバーで提供されているBright Data Web MCPツールに正常にアクセスできることが確認されます。素晴らしい!

ステップ#4:ウェブデータパイプラインを構築する

Web MCPに接続されたExpressチャットで、次のようなプロンプトを入力します:

Connect to my Snowflake instance and retrieve the full record from the Wikipedia table in the AI_TRAINING_DATASET_FROM_WIKIPEDIA database where the "Title" field equals "FIFA World Cup".
Given the retrieved record, scrape the Wikipedia article URL to fetch the latest version of the article in Markdown format.
Then, compare the freshly retrieved content with the version stored in Snowflake and generate a report that:
- Summarizes the key differences between the stored and current versions.
- Highlights any added, removed, or significantly modified sections.
- Identifies major content updates, factual changes, or structural changes.
Present the results in a clear, structured report.

これはエンタープライズデータウェアハウス/データベースからのデータ取得とライブウェブスクレイピングを組み合わせた優れた例です。実際のシナリオでは、特定のビジネス目標に合わせてプロンプトを調整してください。

期待される動作は、Wikipediaコンテンツを抽出、エンリッチ、差分チェックするエンドツーエンドのパイプラインです。静的データ取得のためにSnowflakeに接続し、新鮮なWikipediaデータのスクレイピングにBright Data Web MCPツールを使用します。

プロンプトを実行すると、Nexla ExpressはSnowflakeの接続詳細を入力するフォームを生成します。フォームに入力し「Connect」をクリックします:

Filling out the generated Snowflake connection modal

Nexla ExpressはアクティブなデータソースをセットアップしてSnowflakeデータにアクセスできるようにします。

データベースから要求されたレコードをすべての列を含めて取得します:

The expected Snowflake query and resulting record

次に、(url列から)ページURLを読み取り、Bright Dataのscrape_as_markdownツール(Bright DataのWeb Unlocker APIに依存)を使用してスクレイピングします。ページコンテンツを分析した後、Snowflakeに保存されているデータと比較し、詳細な比較レポートを生成します:

Prompt execution

これは一例に過ぎませんが、同じワークフローを使用して、Web MCPが提供する構造化されたライブスクレイピング機能でデータベースに保存されたデータを継続的に更新したり、新鮮なウェブデータでエンリッチしたりすることもできます。

Bright Data Web MCPツールへのアクセスがなければ、通常のLLMはこのタスクを達成できません。ミッション完了!

ステップ#5:出力を確認する

最終結果は、説明されたプロセスを表すビジュアルなウェブデータパイプラインになります。パイプラインをスケジュールするか、手動で実行してレポートを生成できます:

The web data pipeline produced by Express

Expressは会話チャットをBright Dataを活用した繰り返し可能なウェブデータパイプラインに変換します。

このパイプラインの出力は、データウェアハウスの静的データと新鮮なウェブデータを比較する詳細なレポートです:

The final content comparison report

次のステップとして、会話を続けてNexla Expressに更新されたデータをSnowflakeに書き戻すよう依頼することができます。スナップショットやエンリッチメントワークフローにも活用できます。この新しいプロンプトの結果も生成されたパイプラインを更新します。

以上!これにより、Nexla ExpressにおけるWeb MCPが提供するウェブアクセス、スクレイピング、探索機能が実証されました。この例はシンプルですが、Nexla Express + Bright Data Web MCPは多くの他のエンタープライズユースケースを可能にします。

まとめ

このブログ記事では、Expressとは何か、会話型AIパイプラインビルダーとして何をもたらすかを学びました。特に、Bright Data Web MCPに接続してウェブに直接アクセスできるデータワークフローを構築する方法を説明しました。

Web MCPツールにより、Expressパイプラインは多くのウェブサイトにわたって大規模にウェブデータを確実に検索、探索、スクレイピングできます。また、ウェブページとの自動インタラクションを可能にし、完全なブラウザ自動化ワークフローを構築できます。

ExpressでのWeb MCP統合に問題がある場合、詳細を知りたい場合、またはサポートが必要な場合は、Bright Dataの24時間365日サポートチームにお問い合わせください。

今すぐBright Dataアカウントを無料で作成し、AI対応のウェブデータソリューションの統合を始めましょう!