気になったので投下。
検索クエリ「Sphinn」
Sphinn Japan Blog
ログイン
RSSリスト一覧
今年
とかまではまだ分かるんですけど、
cyberagent
特許
WEB in the morning
それ本当にGoogleのペナルティです …
これは一体・・・そしてTOPページからのリンクはなし。
飛び先URLは以下の通り(一部省略)
Sphinn Japan Blog
→公式ブログ。これは分かる。TOPのタブに入ってる。
ログイン
→ログインなしで投稿ページをクリックするとlogin.php?return=/submit.phpに飛ばされる。
そのページと純粋に「ログイン」をクリックしたページと混同しているっぽい
RSSリスト一覧
→これもわかりやすい。TOPのタブに入ってる。
cyberagent
→何故か検索結果。タグクラウド「今年」ページに入っているのでそこから?
特許
→検索結果。これもタグクラウドページから。
WEB in the morning
→web in the morningさんの個別記事。サイトリンクになるのはいいとしてもなぜこのテキストで?
それ本当にGoogleのペナルティです …
→e-searchさんの個別記事。titleをそのまま抜粋。
今年
→TOPページ「記事の並び替え: 注目の記事 | 本日のトップ記事 | 昨日 | 今週 | 今月 | 今年 |」の「今年」からw
■ナビゲーションから引用すれば美しいのではないかと思うが・・・
イメージ的にはナビゲーションからサイトリンクって抽出しているものだと思っていたんですが、今回の事例はかなりフリーダム。
<ul id="main_tab">
<li id="tab1"><p>注目の記事</p></li>
<li id="tab2"><a href="/upcoming.php" title="新着記事">新着記事</a></li>
<li id="tab3"><a href="http://www.sphinn.jp/greatesthits.php" title="Sphinn Japan Greatest Hits">Sphinn Japan Greatest Hits</a></li>
<li id="tab4"><a href="/cloud.php" title="タグクラウド">タグクラウド</a></li>
<li id="tab5"><a href="/submit.php" title="記事を投稿する">記事を投稿する</a></li>
<li id="tab6"><a href="/topusers.php" title="ユーザーリスト">ユーザーリスト</a></li><li id="tab7"><a href="http://www.sphinn.jp/rss_list.php" title="Sphinn Japan RSSリスト一覧">Sphinn Japan RSSリスト一覧</a></li>
<li id="tab8"><a href="http://blog.sphinn.jp/" title="Sphinn Japan Blog">Sphinn Japan Blog</a></li>
<li id="tab9"><a href="http://www.sphinn.jp/letter.php" title="Sphinn Japan メールマガジン">Sphinn Japan メールマガジン</a></li>
</ul>
この部分から引用して
こういう感じに表示すればキレイになるのになーと。
(現在ユーザー側ではコントロールできませんが・・・)
■変な引用をされている要因を考えてみる
思いつくままに。
・記事関係
→多少は違うものの基本的には記事を入れ替えたような形でページを変えているのでGoogle的にはNG?
・タグクラウド
→飛び先にさらに多くの選択肢があるので不可?
・記事を投稿する
→クローラーがログインページに遷移させられるためログインページと混同
・ユーザーリスト
→本当にただのリストなので中身薄いw
あとは単純に元々こういう表示をされていたもののウェブマスターツールからサイトリンク削除した、とか。
これは管理者のみぞ知る・・・
■アクセス数も加味される?
Googleウェブマスターヘルプの記述は下記の通りです。
現時点では、サイトリンクは完全に自動化されています。Google はサイトリンク アルゴリズムの向上に取り組んでいます。将来的には、ウェブマスターから提供されたサイトリンクも組み込めるようにしたいと考えています。一方、サイトリンクの品質を向上させるために参考にできるベスト プラクティスもいくつかあります。たとえば、サイトの内部リンクでは、簡潔に情報を伝え、繰り返しを避けたアンカー テキストと代替テキストを使用するようにします。
(サイトリンク – ウェブマスター ツール ヘルプ)
その他、参考になりそうな話。
検索結果からの一定以上のアクセスが必要です。
「一定」がどの程度かまでは分かりません。
サイトリンクとして出現するページも、アクセスが多いページのようです。
(Googleサイトリンクの出し方 | 海外SEO情報ブログ 2007.12の記事)
サイト内の構造だけだと思っていました。
海外SEOの記事に関しては2007年のもので現在はどのように変化しているのかわかりませんが、アクセス数を加味するとe-searchさんやweb in the morningさんの記事がサイトリンクとして表示されるのは理解できますね。
タグ : サイトリンク