世界のアクセス数ランキングTOP500のURLを一括取得してみる
他に誰かこんなことしたい人がいるのか分からないけど・・・。
使用するサイトはこちら
Alexa Top 500 Global Sites
上記のサイトで人気サイトが分かるのだが、正確にはアクセス数ランキングとはいえないらしい。
Alexaでサイトの世界ランキング情報 :SEOお勧めツール ::SEO塾(情報サイト)
↑のサイトの説明にあるとおり
実際は、Alexaツールバーがインストール済みのInternet Explorerで閲覧されたサイトのデータである。
日本のWebマスターとしては、Alexaを知っていること、ツールバーをインストールできること、少しは英語が分かること、そういったデータの分母としてユーザーの偏りを割り引いて考える必要はあるだろう。
まぁ、とはいえ、人気サイトであることは間違いないでしょう。
Web::Scraperを使うよ
#!/usr/bin/perl use strict; use warnings; use Data::Dumper; use Web::Scraper; use URI; main(); sub main { print Dumper get_web_site_ranking(); } sub get_web_site_ranking { my $url = "http://www.alexa.com/topsites/global;"; my $site_list = []; for (my $i = 0; $i < 24; $i++) { my $scraper = scraper { process '.offsite', 'site[]' => '@href'; }; my $uri = new URI($url.$i); my $res = $scraper->scrape($uri); push @$site_list, @{$res->{'site'}}; } return $site_list; }
ちょっと汚いけど、まぁ、とりあえず取れたよ。
あとは、このURLをほげほげして、作りたいものを作っていこう。
何を作るのかは、また今度ご報告
では