以前、凄く愛用していたのですが、RSSを使用するようになってからは全く使わなくなってしまいました。
でも、RSSリーダーで取得できない情報もあるのでそれが困りモノだったわけですね。
で、思いついたと言うか、もともとそういう昨日自体はあったみたいなんですが
はてなアンテナをRSSで取得して情報の更新を読み取る
これ、天才じゃね?
とか思って本日ようやく設置完了(5秒)したのですが・・・
以前から気になっていたことの一つとして「アンテナで上がってくるのに実際見に行って見ると更新されていない」というのがあります。
これは非常に不便。
そして今日やっと理由(の内の一つ?)が分かったのでメモ。
とある更新されているサイトの詳細情報をみたところ、単語が並んでるんですね。
(「EXILE」「冷蔵庫」・・・など。もちろん関連性は全然ないサイトです)
これはもしや・・・と思いサイトを見てみたのですが広告は見当たらない。
しかしソースを見ると
noscriptの嵐。
外見はこう。
(非常に見づらいですが)広告の嵐!
何でこんなことしてるんだろうと思ったんですがクローラーがJavaScript動作できないから外部リンク対策といったところですかね。
手法的にあまりに懐かしすぎて忘れてたw
クローキング、不正な JavaScript リダイレクト、誘導ページ
当然ですがNGです。
ユーザーには目の毒にならないよう「消す」設定をしていてロボットには代替テキストとして見せるというNG手法ですね。
アンテナも同じ要領でキャッチしちゃうんだろうな~。
なんとかならないかなあ。これ。






コメント