[[Webプログラミング]] > スクレイピング > Googleリアルタイム検索

#contents

* Googleリアルタイム検索とは? [#b573d308]
Googleリアルタイム検索は、Googleが提供している検索サービスの一つ。
Twitterの投稿など、更新スピードの速いデータを対象として、検索結果を表示する。

** 公式サイト [#j658c055]
http://www.google.co.jp/realtime

** 参考リンク [#w7088d79]
-Google、リアルタイム検索専用ページ「Google Realtime Search」を新設 地域指定やスレッド表示機能も - ITmedia News
http://www.itmedia.co.jp/news/articles/1008/27/news017.html
>2010年08月27日 08時02分
 米Googleは8月26日(現地時間)、リアルタイム検索ページ「Google Realtime Search」を開設したと発表した。検索結果を地域や時間帯でフィルタリングする機能や、Twitterのツイートをスレッドごとにさかのぼって追える機能などがある。日本語版も対応している。
 検索結果には「Google Replay」の時間軸チャート、スクロールするTwitter、Google Buzz、Facebookなどのリアルタイム投稿、最新のブログやニュースが表示される。

-Google Japan Blog: リアルタイム検索に新しい機能が加わりました
http://googlejapan.blogspot.com/2010/08/blog-post_27.html
>2010 年 8 月 27 日
Posted by 倉岡寛 / プロダクトマネージャー
 
ウェブ上にある膨大な情報の中から、フレッシュで関連性の高いものを検索結果に表示するリアルタイム検索、お使いいただけているでしょうか?「今この瞬間」を検索できるこのツールをさらに便利にするべく、Google は本日、リアルタイム検索専用ホームページ [http://www.google.co.jp/realtime] を開設しました。
 
この新しいホームページでは、検索結果を絞り込み、分かりやすくする新しい3つの機能をご用意しました。1 つ目は、地理情報を利用して、お好きな地域の最新情報を検索できるツールです。今度の連休に旅行する予定の方は、現地からツイッターなどで発信されたイベント情報をチェックして、旅行の計画に役立ててみてはいかがでしょうか。
 
2 つ目は、今ウェブ上で話し合われていることが簡単に分かるスレッドモード機能です。マイクロブログ上のひとつの発言が多くの反響を集め、巨大な会話に発展することがありますが、それをすべて確認するためには様々なリンクを何度もクリックする必要がありました。この新しい機能によってそんな煩わしさは解決し、今話題のトピックの全体をひと目で見ることができます。

* スクレイピング [#vd6b84aa]

Googleリアルタイム検索のURLは、以下のようなクエリー文字列を含んでいる。
http://www.google.co.jp/search?tbm=mbl&q=%83%8A%83A%83%8B%83^%83C%83%80%8C%9F%8D%F5

ポイントは、
 tbm=mbl
というクエリー文字列で、リアルタイム検索の選択を指定している。

-リアルタイム検索の結果ページのソースコードを表示させると、JavaScriptのコードの塊だった。
-ソースコードをローカルPC上に保存して、ブラウザで表示させてみたら、リアルタイム検索の結果ページにはなっていなかった。
=AJAXでサーバから検索結果を取得しているみたいなので、検索結果はソースコードには残っていない。

どうやって、スクレイピングすればいいか要調査&検討。

** Yahoo!リアルタイム検索 [#n159a009]
スクレイピング目的なら、[[Yahoo!リアルタイム検索]]を使った方が便利そうだ。
[[Yahoo!リアルタイム検索]]は、検索結果ページがHTMLで記述されており、加工しやすい。

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS