昨日仕掛けをした実験
画像のどこを認識するのかを実験してみる

早くも少し動きが出たので速報で共有。

 

クローラーの遷移

6/13 5:40 実験ページアップ
6/13 7:00 実験記事(実験ページヘのリンク含む)アップ

 

ここからのクローラーの早さが異常。

2012/6/13 7:01 Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html) /lab/gazou-aso-vi-va.php 66.249.67.71
2012/6/13 14:34 SAMSUNG-SGH-E250/1.0 Profile/MIDP-2.0 Configuration/CLDC-1.1 UP.Browser/6.2.3.3.c.1.101 (GUI) MMP/2.0 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html) /lab/gazou-aso-vi-va.php 66.249.67.71
2012/6/13 15:43 SAMSUNG-SGH-E250/1.0 Profile/MIDP-2.0 Configuration/CLDC-1.1 UP.Browser/6.2.3.3.c.1.101 (GUI) MMP/2.0 (compatible; Googlebot-Mobile/2.1; +http://www.google.com/bot.html) /lab/gazou-aso-vi-va.php?img=link 66.249.67.71

リンクを含む記事アップ後、わずか1分で遷移。(厳密にはそれほど時間がかかっていないのかも。)
その後モバイルのbotも来ています。

 

画像検索結果記録(6/14 6:20a.m.前後)

(phpの)ファイル名:変化あり

タイトル:変化あり

 

その他、変化なし

alt

title属性

(pngの)画像ファイル名

周辺テキスト

画像の中の文字列

 

 

実験1日目まとめ

実験ページにクローラーは回っているもののまだ画像は読み込まれていないようです。
ただ、記事をアップしたページ(TOPページ)から情報を取得しているので最も優先されて読み込まれるのは周辺テキストの情報なのではないかと考えています。

またaltに関してはきちんと読み込まれているようで、通常検索の結果には反映されています。

 

反省点

URLの一部で検索しても画像が出てきたのですが、よくよく考えてみたら昨日の記事でリンクを貼る際にURLで貼ってしまってそこが周辺の文字列として判断されているのではないかと。
URLはソースのみで見られる記述に抑えておけばもう少し変わったのかも知れません。

 
追記・実験の結果が出ているものを紹介します
(本記事):【実験速報】画像検索実験の結果(Part.1)「まず周辺の文章を読み込む」
続編(2):【実験速報】画像検索実験の結果(Part.2)「画像と他要素の関係性」
続編(3):【2013.8.6】画像に含まれているtitle属性がテキストの一部として読み込まれる(ただし画像の意味とは紐付けられない)

コメントをどうぞ

CAPTCHA