Welcome to the Bright Data Webinar Hub

Check out the latest and upcoming webinars,
workshops, and coding sessions. 

Live Coding
Build an Amazon Price Tracker with React Native, Supabase, and Web Scraper API
Monthly Highlight
October
Vadim Savin
Founder, Full Stack Developer at notJust.dev
ウェビナー
動的スクレイピングの習得
動的 Web スクレイピング入門 Web スクレイピングでは Web サイトからデータを抽出しますが、これは頻繁に変更される動的コンテンツでは特に困難になります。専門家の Greg、Dario、Diego から、Puppeteer、Selenium、Playwright などのツールを使ってこれらの課題を克服するための、実践的なアドバイスを提供してもらいました。 Greg: サンフランシスコを拠点とする Greg は Andela 社に所属し、従来のソフトウェアエンジニアリングと Web スクレイピングを専門としています。Dario: アルゼンチン出身の Dario は Mabel 社に所属し、ローコードの QA 自動化ツールに注力し、PuppeteerSharp と Playwright の .NET バージョンに貢献しています。Diego: スペインのバレンシアにいる Diego は、Selenium プロジェクトのリーダーであり、クラウドテストプラットフォームである Sauce Labs のオープンソースリーダーでもあります。 主なトピック 1.HTML の変更への対応 Greg は、信頼できるセレクターを選ぶことの重要性を強調しました。div > div > p のようなハードコーディングされたセレクターの長いチェーンは避け、代わりに、aria-label などのより安定したセレクターや、テキストベースのセレクターを使用します。さらに、DOM よりも変更される可能性が低いため、可能な場合は API 要求をインターセプトします。 ツールとテクニック: 2.クライアント側ルーティングとシングルページアプリケーション (SPA) のナビゲート […]
44:56 min watch
ウェビナー
ScrapeOpsをマスターする:スクレイピング作業の最適化
私は5年以上にわたり、Bright Dataのソリューションコンサルタントとして、Webスクレイピングの世界と深く接してきました。これまで、ブロック対策や、安定性およびパフォーマンスの確保、スケーラビリティの管理など、クライアントが直面するさまざまな課題の変化を直に目撃してきました。これらはすべて、時間とコスト効率の両方に多大な影響を及ぼします。本日は、いかに企業がこれらの課題に効果的に対処することができるかについて、私自身の経験から得たインサイトを共有させていただきたいと思います。 Webスクレイピングをインハウスで行うか、アウトソーシングで行うかを決める 企業が直面する普遍的なジレンマの1つとして、独自のスクレイピングツールを開発するか、専門のサービスに対しアウトソーシングを行うかの選択が挙げられます。私の考えでは、特にインハウス開発に必要なリソース配分を考慮した際には、ほとんどの場合においてアウトソーシングがより現実的な選択肢のように思えます。 トレードオフ:インハウス開発とアウトソーシング ハイブリッドおよびサーバーレスモデルの検討 ハイブリッドモデルとサーバーレスモデルのどちらを選択するかが、Web スクレイピング戦略に大きく影響します。ハイブリッドアプローチでは、レンタルのプロキシインフラストラクチャと自社での開発機能を統合することにより、柔軟性が得られます。一方、サーバーレスソリューションではデータ処理をプロバイダに任せることができるため、プロセスが簡素化されます。 プロキシの最適化が果たす重要な役割 シームレスなWebスクレイピングのためには、効果的なプロキシ管理が不可欠となります。このためには、Bright Proxy Managerを強くお勧めします。このオープンソースツールは、プロキシアクティビティを監視するための堅牢なソリューションを提供し、最適化と詳細なトラブルシューティングの両方を可能にします。成功率や帯域幅の使用状況などを含むプロキシパフォーマンスを包括的に把握できるため、プロキシ管理の複雑さが軽減されます。また、ユーザーフレンドリーなインターフェースと詳細なログ機能により、潜在的な問題を迅速に特定して解決し、スクレイピング作業をスムーズかつ効率的に実行することが可能となります。 適切なIPタイプを選択する Webスクレイピング作業に適したIPタイプの選択は、データ収集作業の結果と効率に大きな影響を与える可能性がある重要な決定です。私の経験では、データセンターIPと住宅用IPの微妙な違いを理解し、Bright DataのWeb Unlockerサービスを利用することが、スクレイピング対策という壁を乗り越え、必要な結果を得るためのヒントとなります。 特にUnlockerはゲームチェンジャーであることが証明されており、厳重なウェブサイトの防御策を簡単に回避して、これまでアクセスできなかったデータへのアクセスを実現します。これは、スクレイピングの課題に適したIPタイプを選択することの重要性を示しています。 ブラウザの自動化を活用する フォームへの入力や複数ページ間の移動など、動的な操作を必要とするウェブサイトを扱う際には、ブラウザの自動化を活用することが不可欠です。これまでPuppeteerのようなツールが、これらのプロセスを自動化し、実際の人間のアクティビティと区別がつかない方法でユーザーの動作をシミュレートするのに役立ってきました。 しかし、Webスクレイピングの効率性は、単に防御策を回避するということではなく、最もリソース効率の高い方法でそれを行うことによって定義されます。必要なリクエストに重点を置き、余分なコンテンツのダウンロードを回避することで、帯域幅の消費を大幅に削減し、スクレイピングの全体的なパフォーマンスを向上させることができます。 Bright Dataのスクレイピングブラウザの紹介 ウェブページの複雑化やボット対策の強化に伴い、より高度なソリューションが必要であるとの認識から、この度、Bright Data ではスクレイピングブラウザの開発を行いました。このツールでは、当社の先進的なフィンガープリント技術および堅牢なプロキシ管理を、ブラウザの自動化機能とシームレスに統合し、現代のWebスクレイピングタスクの複雑なニーズに応えた包括的なソリューションを提供します。セッションごとに独自のブラウザ環境をエミュレートできるため、最高レベルの慎重さと有効性が求められる作業において、非常に価値のあるツールとなります。 Bright Dataの機能を使用してWebスクレイピングの効率化を行う Bright Dataでは、高水準の効率性と成功率を維持しながら、より幅広いユーザーが利用できるよう、Webスクレイピングプロセスの効率化に努めています。当社のプラットフォームは、最小限のコーディングで人間の動作を模倣するスクレイピングスクリプトの開発を簡素化しています。このユーザーフレンドリーなアプローチは、ウェブデータの活用を検討している企業の参入障壁を低めるだけでなく、データ取得の複雑さに悩まされることなく、分析と活用に集中することを可能とします。 スクレイピングプロセスを簡素化するツールを提供することで、企業がコア・コンピテンシーに集中し、革新と成長を促進できるようにします。 まとめ:コアに忠実であり続けよう 何よりも私が伝えたいメッセージは、「ビジネスにとって最も大切なことに集中することがいかに重要か」ということです。スクレイピングがコア業務ではない場合、外部のテクノロジーやサービスを活用することを検討しましょう。適切なモデルを選択し、スクレイピング戦略を最適化することで、時間とリソースを大幅に節約でき、競争力を維持することができます。 Bright Dataでの長きにわたる経験から得られたこれらのインサイトが、新たな自信と効率性とともに、複雑なWebスクレイピングの世界をナビゲートする力となることを願っています。
23:01 min watch
get inspired

How developers leverage Bright Data

The Data You Need
Is Only One Click Away.