世界中の20,000+人のお客様に信頼されています
Available datasets
Access fresh validated GitHub datasets. Ensure hassle-free data access by using ready-made scrapers.
- Demo data in JSON/CSV
- Fresh records
- Customize, enrich, and format the data
LinkedIn people profiles
Amazon products
LinkedIn company information
Instagram - Profiles
Crunchbase companies information
Linkedin job listings information
Zillow properties listing information
Instagram - Posts
LinkedIn posts
X (formerly Twitter) - Posts
Google Maps full information
TikTok - Profiles
Facebook - Pages Posts by Profile URL
Youtube - Videos posts
Amazon Reviews
TikTok - Posts
Indeed job listings information
Shopee - products
Companies information enriched dataset
Walmart - products
Employees business enriched dataset
TikTok Shop
YouTube - Profiles
Glassdoor companies overview information
IMDB media
Airbnb Properties Information
X (formerly Twitter) - Profiles
Google maps reviews
Google News
Yahoo Finance business information
Reddit- Posts
Instagram - Reels
Booking Hotel Listings
Shein- Products
Yelp businesses overview
Glassdoor companies reviews
LinkedIn profiles Jobs Listings
Facebook - Comments
Instagram - Comments
Zoominfo companies information
pitchbook companies information
Glassdoor job listings information
Otodom Poland
Amazon products global dataset
Amazon sellers info
eBay
Google Shopping
G2 software product overview
Github repository
Amazon best seller products
Facebook - Posts by group URL
Australia real estate properties
Home Depot US
Facebook Marketplace
Facebook - Posts by post URL
Google Play Store
TikTok - Comments
Trustpilot business reviews
Etsy
G2 software - product reviews
Amazon products search
Booking Listings Search
Goodreads books
Yelp businesses reviews
Reddit - Comments
Amazon Walmart
Zara - Products
Zillow price history
World population
Indeed companies info
Target
Zoopla properties listing information
Wikipedia articles
Pinterest - Posts
Lazada - Products
Youtube - Comments
NBA players' stats
Best Buy products
Facebook - Profiles
Walmart sellers info
Facebook Events
Ikea - Products
Realtor international properties listings
Sephora products
Lowes.com
BBC news
OLX Brazil - marketplace ads
Ozon.ru products
Xing social network
Facebook - Reels by profile URL
Google Play Store reviews
Facebook Company Reviews
Myntra products
Creative Commons Images
Google Shopping products search US
Owler companies information
H&M - Products
Slintel 6sense company information
Wayfair products
Naver products
US lawyers directory
Webmotors Brasil - Cars Listings
Tokopedia Products
Apple App Store reviews
Manta businesses
Digikey - Products
CNN news
Agoda Properties Listings
Wildberries.ru products
Mouser - Products
Facebook - Pages and Profiles
Zonaprop Argentina - Properties Listing
Quora posts
Carsales Cars Listings search page information
Pinterest - Profiles
Chileautos Chile - Cars Listings
VentureRadar company information
Zalando products
Inmuebles24 Mexico - Properties Listings
carsales.com.au - Cars Listings
Yapo Chile - marketplace ads
Asos - Products
Trustradius product reviews
Lazada - Reviews
Bluesky - Posts
Hermes- Products
Lego - Products
Vimeo - Videos posts
World zipcodes
Metrocuadrado - Properties Listings
Chanel Products
Home Depot CA
Lazada products search (GMV)
Toctoc - Properties Listings
Dior - Products
Top 500 Bluesky Profiles
Apple App Store
Creative Commons 3D Models
Ashleyfurniture - Products
mercadolivre.com.br products
AE.com - Complete Products
Properati Argentina and Colombia - Properties Listings
Infocasas Uruguay - Properties Listings
Mango Products
Balenciaga.com - Products
Mediamarkt.de products
Kroger.com
Fanatics.com - Products
Toysrus - Products
Zara Home Products
Carters.com - Products
Twitch - streams dataset
Loewe.com - Products
Prada.com - Products
Rona.ca products
Fendi Products
Crateandbarrel - Products
ChatGPT Search
Delvaux - Products
Ysl.com - Products
Massimo Dutti - Products
Bottegaveneta.com - Products
Mattressfirm - Products
Raymourflanigan.com - Products
llbean.com - Products
Sleepnumber.com - Products
Celine.com - Products
Mybobs.com - Products
La-z-boy.com - Products
Berluti.com - Products
Montblanc - Products
Walmart - products zipcodes
Moynat.com - Products
Google SERP - 100 Results
Suumo.jp
Threads - Posts
Google AI Mode Search
Zillow Full Properties Information
Macys.com
Gemini Search
Agoda Listings Search
Threads - Profiles
Trip Listings Search
Falabella.com
Perplexity Search
LinkedIn people search
Grok Search
Zillow properties search page
Walmart products search
Bing Copilot Search
Trip Hotel Listings
Snapchat posts
Goodreads reviews
TikTok - Posts by URL Fast API
Snapchat profile
Agoda Properties Listings with Pricing
Reddit - Profiles
Flipkart.com
TikTok - Posts by Search URL Fast API
TikTok - Posts by Profile Fast API
Coupang products
TikTok Shop Category Products
Booking Hotel Listings with Pricing
Google Hotel
データセットの価格設定
- クリーンで有効
- 毎月更新
- JSON/CSV/Parquet
AIエージェントを即座にパワーアップ
私たちのGithubデータセットは、AI/LLMに最適化されています。 レシピが用意されています。
構造化&クリーン
AIモデルのトレーニングや推論に最適な、一貫性のあるスキーマで前処理されたデータ。
コード例
すぐに使えるPython、Node.js、cURL、PHP、Go、Java、Rubyのスニペットで、AIワークフローに簡単に統合できます。
ドキュメンテーション
curl --request GET
--url https://api.brightdata.com/datasets/snapshots/{id}/download
--ヘッダー 'Authorization:ベアラ'
インポートリクエスト
url = "https://api.brightdata.com/datasets/snapshots/{id}/download"
headers = {"Authorization":"ベアラ"}。
response = requests.get(url, headers=headers)
print(response.json())
const url = 'https://api.brightdata.com/datasets/snapshots/{id}/download';
const options = {method: 'GET', headers:headers: {Authorization: 'Bearer'}, body: undefined};
try {
const response = await fetch(url, options);
const data = await response.json();
console.log(data);
} catch (error) {
console.error(error);
}
HttpResponse response = Unirest.get("https://api.brightdata.com/datasets/snapshots/{id}/download")
.header("Authorization", "ベアラ")
.asString();
require 'uri'
require 'net/http'
url = URI("https://api.brightdata.com/datasets/snapshots/{id}/download")
http = Net::HTTP.new(url.host, url.port)
http.use_ssl = true
request = Net::HTTP::Get.new(url)
request["Authorization"] = 'ベアラ'
response = http.request(request)
puts response.read_body
お客様のニーズに応えるGitHubデータセット
データの購読
サブスクライブしてデータセットにアクセスすると、コストが大幅に削減されます。
ファイル出力形式
JSON、NDJSON、JSON Lines、CSV、Parquet。オプションの.gz圧縮。
柔軟なデリバリー
Snowflake、Amazon S3バケット、Google Cloud、Azure、SFTP。
スケーラブルなデータ
インフラ、プロキシサーバー、ブロックを気にすることなく拡張できます。
コスト削減
フィルターやフォーマットオプションを使って、データセットをカスタマイズできます。
コードのメンテナンス
データセットは、ウェブサイトの構造変更に基づいて維持されます。
簡素化された統合
SnowflakeおよびAWSとの統合によるメリット。
年中無休のサポート
データの専門家チームがお手伝いします。
コンプライアンスのリーダー
データは倫理的に取得され、すべての個人情報保護法に準拠しています。
構造化された信頼性の高いGitHubデータを入手
当社がデータを提供するので、お客様は他の業務に集中できます
大容量のウェブデータ
ブロック解除機能と24時間体制のIPローテーションにより、ウェブサイト上のすべてのデータポイントへのアクセスを保証します。
すぐに使用できるデータ
強力なデータ検証プロセスの一環として、データ収集プロセスのあらゆる側面が徹底的に検証されています。
自動データフロー
カスタムスケジュールを作成してデータデリバリーを自動化すれば、データがストレージにシームレスに流れます。
企業によるGitHubデータセットの利用例
開発の取り組み
コミュニティの関与
エンゲージメントを高める
GitHubデータセットに関するよくある質問
GitHubデータセットにはどのようなデータが含まれていますか?
GitHubデータセットには、あらゆるユーザーのニーズに合わせてさまざまなデータポイントが含まれています。データポイントには、URL、ID、コード、コード言語、行数、ユーザー名、ユーザーURL、サイズ、サイズ単位、サイズ番号、プロジェクト数、フォーク数、スターの数などが含まれます。
購入したGitHubデータセットの更新情報を入手できますか?
はい、GitHubデータセットは、毎日、毎週、毎月、またはユーザー設定による頻度で更新できます。
GitHubデータセットのサブセットは購入できますか?
はい、お客様が必要とするデータポイントのみを含むGitHubサブセットをご購入いただけます。これにより、コストを大幅に削減できます。
GitHubデータセットはどのような形式で提供されますか?
データセットの形式は、JSON、NDJSON、JSON Lines、CSV、またはParquetで提供されます。なお、オプションでファイルを.gzに圧縮することもできます。
GitHubの公開データを自分でスクレイピングすることはできますか?
データセットの購入を希望しない場合は、当社のGitHubスクレイパーAPIを使用して、GitHubデータをスクレイピングできます。
データサンプルを入手することはできますか?
はい、情報の質や関連性の評価のためにサンプルデータをリクエストしていただけます。これは、完全なデータセットを購入する前に、商品がニーズを満たしているかどうかを確認するのに最適です。
GitHubデータセットから特定のデータポイントをリクエストできますか?
はい、プロジェクトに必要な情報を正確に受け取ることができるように、独自のニーズに合わせてGitHubデータセットから特定のデータポイントをリクエストしていただけます。
GitHubデータセットを既存のシステムに直接統合することはできますか?
もちろんです。GitHubデータセットはシームレスなAPI統合を提供しており、顧客関係管理や分析ツール、またその他のあらゆるシステムにデータを簡単に統合することができるため、業務の合理化が実現します。