画像検索とクローラー

2chのまとめサイトを見ていたら

乳酸菌取ってる?水銀燈の画像くれ

というのがあって、なかなか良スレだったので、こういった「要求を投げたら色んな所からレスポンスが来る」というシステムに検索エンジンは勝てるのだろうか?

…とか偉そうなことを考えていたのですが、案外、検索エンジンの画像検索も優秀w

個人的にはgoogleの画像検索の方が好きですw

**

「萌え茶」検索に関して。

いまだに画像検索で「萌え茶」出てこないな…と思ったら、このページ画像検索用のロボットが(多分)来てないんですね。

画像検索用ロボットは下記のUserAgentの模様。

Googlebot-Image

【参照】Google イメージ検索からイメージを削除する

こっちはYahoo!

Yahoo-MMCrawler

【参照】私のホームページの画像、音声、動画が検索されないようにしたい

ふーむ。
両エンジンとも画像の削除内容は書いてるんだけど、どう呼び込むかは書いてないのよね。
ウェブマスターツールで画像内容の精度を上げるためのラベラー登録すればいいというわけでもなさそうだし。

ちなみにドメイン(bakaweb.cocolog-nifty.com/)で画像検索するとココログアフィリエイトの商品画像ばっかり出てくる。

あとはこのサイトにリンク貼ってる他のサイトの画像とか。

これは

ココログアフィリエイトの画像…amazonが元ネタなのでインデックスサーバーに既に補完されている⇒通常クローラーが回った際に関連付け?

他のサイトの画像…他のサイトが既にImagebotの回っている所で、ソース内のURL(http://bakaweb.cocolog-nifty.com/)が画像と関連付けられる?

大まかに見るとだけど、ロボットだけで読み取った場合かなり曖昧な抽出の仕方になってると思うよw

ラベラー使って精査してくれてる方々に感謝!
Google Image Labeler

コメント

タイトルとURLをコピーしました