【実体験】2MB以上のhtmlファイルを作ってみた

(この記事は1分で読めます)

2MB以上のhtmlファイルを作った時にGoogleはどこまで読むのか検証をしてみました。

気付き1:そもそも人が読めない

作ったファイルはこちら。※めちゃめちゃ重いです

実証!これが2MBのhtmlだ!

アクセスしてみると分かるのですがそもそも全然読み込みません…
実際に使ってみるとブラウザの挙動が重すぎてスクロールすらままならないことも分かると思います。

気付き2:ライブテストができない

2MBを越えた当たりのところにメッセージを仕込み、Googleが読めるのかを検証してみようと思いましたが、そもそもSearchConsoleでライブテストを行ってみたのですが何回やってもエラーが出ます。

読み取りの上限を検証する以前に、Googlebotが解析をタイムアウトしているようです。
人が読むのに困難なものはGoogleにとっても解析困難なのかもしれません。

追記:インデックスのリクエストも難しかったです。

一言

そもそも2MB以上のhtmlというのはシンプルなものでもこれだけ重いので、一般的に気にしなくていいと言われているようにやっぱり気にする必要はないのではと思いました(小並感)

参考:Googlebotの2MB制限とは? クロール制約とSEOベストプラクティスまとめ

〜終〜

おまけ1(追記):このファイルどうやって作ったの?→Python

ファイルはPythonで作成してhtmlに出力できるようにしました。
(コード考えたのはAI)

おまけ2(追記):テキストではなく変数にして隠してレンダリング負荷を減らすとどうか→軽くなりました

コメントいただき、レンダリングの負荷が大きすぎるというのはたしかになーと思ったので試してみました。

こちらです。
実証!これが2MBのhtmlだ!(Script)

サクサクですw

URL検査も通りますし、2MB以降も見えている。エラーはレンダリング側の問題だった様子。

インデックス申請も可能に。

インデックスもされた。

検索結果。2MB以降のところも読んでいそう。

今回の検証(n=1)で2MB以降もちゃんと読まれたので、厳密に2MB以降が切られるとかではないと思うのですが、これも極端な造り(ほぼコメントアウト)なのでインデックス周りの参考にはなりづらそうです。

ただ、結論としては2MBって特殊な激重ファイルには違いなくあまり気にすることではなさそう。

公式文献
Inside Googlebot: demystifying crawling, fetching, and the bytes we process  |  Google Search Central Blog  |  Google for Developers

ブログへのサポートのお願い(アマゾンギフト)

いつも「バカに毛が生えたブログ」をご愛読いただきありがとうございます。

現在、このブログは皆様のおかげで無料・広告なし(※)で運営しております。
※AdSenseはセンシティブ判定されてしまうため、広告を掲載できません。

ブログの継続とさらなる充実のためご支援をお願いします。
支援は一度限りのショット支援として、¥150から可能です。

いただいた支援は、以下のような形で活用させていただきます:

  • サーバー費用やサイトの維持
  • 新しいコンテンツの作成
  • モチベーション

ご希望の方はスパチャ読みをいたしますので、その旨をお知らせください。

ご支援はより良いブログを提供するための力になります。

こちらのメールアドレスを送信先にしてください。
↓タップするとコピーされます

コメント

タイトルとURLをコピーしました