以前「Yahoo!とGoogleの検索結果反映のタイムラグを調べてみた」という更新をした際に、検索結果反映まで20分位かかった、ということを書いたのですが最近どうもその速さが上がっている気がするのでその更新をば。
■昨日の更新
5/5の17:38に「facebookとmixiとtwitterのゆるい使い分けができてきた」という更新をしたのですが、更新直後の検索結果がこんな感じ。
Google(17:39)
Yahoo!(17:39)
「1分前」の表記が。
これは恐ろしい。GoogleとYahoo!のタイムラグもほぼ無し。
■キャッシュ
更新ページ
キャッシュ日時:5/5 8:38:13
→日本時間 5/5 17:38:13
TOPページ
キャッシュ日時:5/5 8:38:01
→日本時間 5/5 17:38:01
更新して数秒でロボットが来てる!
Yahoo!のキャッシュはYahoo!のロボットが取得しているのでないっぽいです。
cache:コマンドも使用できなかった。
■ロボットのログ
ココログの限界か。相変わらずGooglebotのログ無し。
全部のbotのログ取れてないかというとそういうわけでもなくて
こんな感じで取得出来てるのもあるんですけどね。これはいまだによく分からない。
■更新状況が影響する?
前回の調査(Yahoo!とGoogleの検索結果反映のタイムラグを調べてみた)の時は20分程度かかっていたのに、今回はどうして1分もかからないのか?
推測しているのは以下2点。
・Googleの性能アップ
・更新性の違い
「Googleの性能アップ」という考えもあるにはあるのかも知れないけど、さすがにそれは知る由も無し。(20分で反映するところを1分で反映できるようになりました!というのを証明するのは難しい・・・)
なので今回は「更新性の違い」として考えてみることにします。
・前回の更新
比較的短い期間で更新しているものの不定期です。
(※青字部分が前回検証で使用した更新)
・今回の更新
4月末に一旦更新が空いてしまったものの(すいませんw)、ほぼ毎日更新しています。
■Google視点で考える
Google視点に立って考えてみます。
「更新頻度が低い」
→このサイト、更新頻度が低いからたまに来ればいいや。何回も来ても更新されてないことが多いし・・・
「更新頻度が高い」
→このサイト、頻繁に来ないと次から次へと新しい情報が更新されているな。こまめにチェックしよう。
・・・とこれだけ書くと、TOPの一文だけ変更してみる、みたいな発想って生まれると思うんですが、仮にそれをGoogle視点で見ると
一文だけ毎日更新されているサイト
→毎日更新されてるけど、別に大したこと書いてないしたまに来ればいいか。
となり、推奨できるものではありません。
(クローラーの経緯を見てないので分かりませんが、自分がもしもGoogleの技術者であればそういう区別は出来るように作ります)
■まとめ
仮にロボットの訪問度が更新頻度によって変化するのであれば、「更新性」もサイトの有益性の一部に関わっているのではないでしょうか。
もちろん様々な要素のうちの一つで、そこから「twitterなどで評価される」「被リンクを受ける」(チラッ)などの要素が次々に加わっていくことによりGoogleの評価が強固になっていくのだと思います。
※追記
更新頻度の低いブログで試してみましたがping送信することでキャッシュ自体は物凄く高速で処理されるみたいです。
ただ、検索結果への反映が気持ちちょっと遅い(やはり20分程度)感じでした。
タグ : コンテンツ発想