LLMs.txt(主要LLMは使用していないため、現時点で作ってもあまり意味のないものです)の話が、先日飲み屋の雑談ベースで出てきました。
そもそも自分は書き方すら知らなかったので体験ベースで作ってみることに。

自動生成ツールが存在した

調べていく中で下記のようなツールがあり、URL(TOPページ)を流し込むと自動生成してくれるとのこと。
https://llmstxt.firecrawl.dev/

sitemapを自動生成してくれるような存在ですね。

出来た結果

で、生成されたのがこちら。

*Note: This is an incomplete result, please enable full generation by entering a Firecrawl key.

# https://www.baka-ke.com/ llms.txt

– [Search News Summaries](https://www.baka-ke.com/): Weekly search news summaries and SEO insights from Twitter.
– [XML Sitemap Index](https://www.baka-ke.com/sitemap.html): XML sitemap for search engines with sub-sitemap links.
– [FG’s SEO Blog](https://www.baka-ke.com/about/): A blog by FG sharing SEO insights and experiences.
– [Mac Excel Crash Logs](https://www.baka-ke.com/mac-excel-crash-log/): Explore common Mac Excel crash logs and user experiences.
– [Google Updates Memo](https://www.baka-ke.com/google-update-memo/): Latest Google updates and announcements for webmasters.
– [Google Dance Tokyo Life](https://www.baka-ke.com/google-dance-tokyo-%e3%81%ab%e8%a1%8c%e3%81%8d%e3%81%9f%e3%81%8b%e3%81%a3%e3%81%9f%e3%81%a0%e3%81%91%e3%81%ae%e4%ba%ba%e7%94%9f/): A humorous take on missing Google Dance Tokyo event.
– [GRC for Mac Solutions](https://www.baka-ke.com/grc-for-mac/): Explore methods to run GRC on Mac effectively.
– [Contact Us](https://www.baka-ke.com/toiawase/): Contact form for inquiries and feedback submissions.
– [Understanding Soft 404 Errors](https://www.baka-ke.com/404-not-found/): Exploring the concept of soft 404 errors in detail.
– [Natto TKG Recipe](https://www.baka-ke.com/m-ntkg-recipe/): Delicious natto egg rice recipe with fluffy egg whites.

書いてある内容は以下。(翻訳)

*注:これは不完全な結果です。Firecrawlキーを入力して完全な生成を有効にしてください。

# https://www.baka-ke.com/ llms.txt

– 検索ニュースサマリー](https://www.baka-ke.com/): 毎週Twitterから検索ニュースの要約とSEOの洞察を提供。
– XMLサイトマップインデックス](https://www.baka-ke.com/sitemap.html): 検索エンジン用のXMLサイトマップとサブサイトマップリンク。
– FGのSEOブログ](https://www.baka-ke.com/about/): FGによるSEOの洞察と経験を共有するブログ。
– Mac Excel Crash Logs](https://www.baka-ke.com/mac-excel-crash-log/): Macのエクセルのよくあるクラッシュログやユーザーの体験談を紹介。
– Google Updates Memo](https://www.baka-ke.com/google-update-memo/): Googleの最新アップデートとウェブマスター向けのお知らせ。
– [Google Dance Tokyo Life](https://www.baka-ke.com/google-dance-tokyo-%e3%81%ab%e8%a1%8c%e3%81%8d%e3%81%9f%e3%81%8b%e3%81%a3%e3%81%9f%e3%81%a0%e3%81%91%e3%81%ae%e4%ba%ba%e7%94%9f/): Google Dance Tokyoの見逃したイベントをユーモラスに紹介。
– GRC for Macソリューション](https://www.baka-ke.com/grc-for-mac/): MacでGRCを効果的に実行する方法を探ります。
– お問い合わせ](https://www.baka-ke.com/toiawase/): お問い合わせフォーム
– ソフト404エラーを理解する](https://www.baka-ke.com/404-not-found/): ソフト404エラーの概念を詳しく解説。
– 納豆TKGレシピ](https://www.baka-ke.com/m-ntkg-recipe/): ふわふわ卵白のおいしい納豆卵かけご飯のレシピ。

なるほど、サイトの重要な箇所をLLMに効率的に伝えるというものなのね。
(「納豆TKG」とか「Mac Excel Crash Logs(エクセルクラッシュログ)」とか、なぜそのコンテンツを抜粋したんだ感はあるw)

LLMs.txtの概要をDeepResearchで調べてみた

そもそもLLMs.txtがなぜ出てきたのか概要を調べてみました。

…が、長すぎるのでインフォグラフィックにしてもらいました。便利ですね。

インフォグラフィック:LLMs.txtの動向と市場調査(Gemini生成)

5行で要約

さらにGeminiに5行で要約してもらった内容。

  • llms.txtはAI向けウェブガイド: ウェブサイトの情報をAI(LLM)が効率的かつ正確に理解するための、ノイズ除去とコンテンツ整理を目的としたMarkdownファイル。
  • 提唱は2024年9月: 技術的非効率性の解消と知的財産権保護を背景に、Jeremy Howard氏が提唱しました。
  • robots.txtとは目的が異なる: クロール制御のrobots.txtに対し、llms.txtはコンテンツの「意味」をAIに伝える新しい役割を持ちます。
  • 導入はまだ限定的: 調査で導入率は低く、Googleは有効性を疑問視しているものの、Anthropicなど一部AI企業は利用に関心を示しています。
  • 将来のAI最適化への一歩: 現状は必須ではないですが、AI駆動型検索の普及次第では「Generative Engine Optimization (GEO)」の重要な要素となる可能性があります。

つまり現時点で作る重要性は非常に低い。

ChatGPTに聞いてみた

ChatGPTに聞いてみたのがこちら。

「文章として読んでるだけ」というのがすごく表現としてわかりやすいなと。

感想

冒頭に書いた通り現時点で作ってもあまり意味のないものです。

LLMにわかりやすくサイトの内容を伝えるものとして概念を作った、というところまではわかる。
ただ、これってあくまでちゃんとサイトオーナーが管理する前提での話であって、仮に浸透したとしても管理が適切に行われることがなさそうだなとか、スパマーにはスパムに使われそうだなと思いました。

以上、感想でした。

〜おわり〜

おまけ

「もっと過激に!」というリプをいただいたのでGeminiに過激に書かせてみました。

【ネタ】全くもって意味不明!LLMs.txtなんてクソどうでもいいもの、面白半分で書く羽目になった話

ブログへのサポートのお願い(アマゾンギフト)

いつも「バカに毛が生えたブログ」をご愛読いただきありがとうございます。

現在、このブログは皆様のおかげで無料・広告なし(※)で運営しております。
※AdSenseはセンシティブ判定されてしまうため、広告を掲載できません。

ブログの継続とさらなる充実のためご支援をお願いします。
支援は一度限りのショット支援として、¥15から可能です。

いただいた支援は、以下のような形で活用させていただきます:

  • サーバー費用やサイトの維持
  • 新しいコンテンツの作成
  • モチベーション

ご希望の方はスパチャ読みをいたしますので、その旨をお知らせください。

ご支援はより良いブログを提供するための力になります。

こちらのメールアドレスを送信先にしてください。