【メモ】JaveScriptでコンテンツの内容が変わるページと各LLMの読み込み状況

JaveScript有無でコンテンツの内容が異なるページを用意して、各LLMがどのように読むのかをテストしました。

使用したページ(JavaScriptでコンテンツを書き換える)

JavaScript 100日写経のどこかのタイミングで作成したページ。


同じページで上がJaveScriptオン、下がJaveScriptオフ。

プロンプト

こんなプロンプトを投げました。(NotebookLMはURLのみを投げた)

このページにアクセスして中身を読んで
https://www.baka-ke.com/lab/syakyo/test.php

ログもサイト側で別途取得して確認。

結果

ChatGPT:HTMLを読む

ログ
2025-08-10 20:10:02 | IP: 74.7.36.100 | UA: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko); compatible; ChatGPT-User/1.0; +https://openai.com/bot

抜粋

現時点では特に動的な内容や詳細なデータは含まれておらず、ページには単なる初期表示用のサンプルテキストが記載されているのみのようです。必要であれば、これを基にどのような改善や変更をご希望か、お知らせください。

Perplexity:HTMLを読む

ログ
2025-08-10 20:10:48 | IP: 44.208.221.197 | UA: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Perplexity-User/1.0; +https://perplexity.ai/perplexity-user)

抜粋

主な内容:

「これは初期HTMLのテキストです。」という文章が計数回ならんで表示されています。

文章の間には改行があり、段落として区切られています。

このページはサンプルやテスト用の初期状態であり、特定の機能や情報を持つものではなく、単に繰り返しのテキストが表示されているだけです。

他に意味のある文字列や動作は確認できませんでした。

Claude:HTMLを読む

ログ
2025-08-10 20:11:18 | IP: 34.34.241.29 | UA: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Claude-User/1.0; +Claude-User@anthropic.com)

抜粋

このページの内容を確認しました。「これは初期HTMLの状態です」というタイトルで、ページには「これは初期HTMLのテキストです。」という文章が繰り返し表示されているシンプルなHTMLページのようです。
このページは恐らくテスト用のページか、何かの動作確認のために作られたもので、基本的なHTMLの構造を持っているようですね。特別な機能や複雑な内容は含まれていない、シンプルなテキストページです。
このページについて何か特定のことを知りたい点があれば、お聞かせください。

NotebookLM:HTMLを読む

ログ
2025-08-11 08:39:59 | IP: 66.249.84.102 | UA: Google-NotebookLM
2025-08-11 08:39:59 | IP: 66.249.84.104 | UA: Google-NotebookLM

抜粋

提供されたテキストは、初期HTMLの状態というタイトルを持つ日本語の文書の一部です。この文書は、初期のHTMLがどのようなものであったかを説明しているようです。具体的には、「これは初期HTMLのテキストです」というフレーズが繰り返し使われていることから、その基本的な内容や構造を示していると考えられます。この記述は、初期HTMLの性質を読者に伝えることを意図しています。

Gemini:HTMLを読む

ログ
2025-08-10 20:11:31 | IP: 108.177.77.67 | UA: Google

抜粋

提供されたウェブサイトのコンテンツは以下の通りです。

ウェブサイトのコンテンツは、初期HTMLの状態について説明しています。具体的には、「これは初期HTMLの状態です」という見出しと、「これは初期HTMLのテキストです」というテキストが複数回繰り返されています。

Gemini DeepResearch:読めなかった

Geminiと別にやる必要あるのかと思ったものの、UAが違うというのを先日知ったのでこれもメモ用に。ただ、アクセスできないという結果に。
特にブロックなどは行っていないため原因は不明。

ログ
2025-08-10 22:54:02 | IP: 108.177.67.167 | UA: Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Gemini-Deep-Research; +https://gemini.google/overview/deep-research/) Chrome/135.0.0.0 Safari/537.36

抜粋

調査の結果、当該ページは現在アクセス不能であることが明確に判明しました。直接的なアクセス試行およびウェブアーカイブを通じたコンテンツ取得の試みは、いずれも成功しませんでした。

Yahoo!AIアシスタント:来ない

2025年8月28日追記。

ログなし。

抜粋

申し訳ありませんが、その質問にはお答えできません。

(参考)Search Consoleライブテスト:JavaScriptを読む

ログ
2025-08-10 22:46:49 | IP: 66.249.79.168 | UA: Mozilla/5.0 (compatible; Google-InspectionTool/1.0;)
2025-08-10 22:46:50 | IP: 66.249.79.168 | UA: Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/138.0.7204.183 Mobile Safari/537.36 (compatible; Google-InspectionTool/1.0;)

ブログへのサポートのお願い(アマゾンギフト)

いつも「バカに毛が生えたブログ」をご愛読いただきありがとうございます。

現在、このブログは皆様のおかげで無料・広告なし(※)で運営しております。
※AdSenseはセンシティブ判定されてしまうため、広告を掲載できません。

ブログの継続とさらなる充実のためご支援をお願いします。
支援は一度限りのショット支援として、¥15から可能です。

いただいた支援は、以下のような形で活用させていただきます:

  • サーバー費用やサイトの維持
  • 新しいコンテンツの作成
  • モチベーション

ご希望の方はスパチャ読みをいたしますので、その旨をお知らせください。

ご支援はより良いブログを提供するための力になります。

こちらのメールアドレスを送信先にしてください。
↓タップするとコピーされます

コメント

タイトルとURLをコピーしました