【2026年版】llms.txt 2.0/AI Discovery Manifest実装ガイド——AIエージェントに自社サイトを機械可読で宣言するrobots.txt/sitemap.xml/llms.txtの3層運用設計

  1. はじめに——「AIに読まれるサイト」と「読まれないサイト」の差は、もう見えている
  2. 2026年現在のllms.txtエコシステム——どのAIエージェントが読み、どう影響するか
    1. llms.txtとは何か(簡単な復習)
    2. 2026年時点で「読みに来る」主要なAIエージェント
  3. robots.txt/sitemap.xml/llms.txtの3層の役割分担
    1. 3層運用のイメージ
  4. llms.txt 2.0で宣言できる新項目——「マニフェスト化」の正体
    1. llms.txt 2.0で宣言できる主な新項目
    2. llms.txt 2.0の記述例(実用テンプレート)
  5. 「AI Discovery Manifest」的な拡張——コンテンツ階層と読解順の明示
    1. 例:階層構造を伝える
    2. 関連エンティティの明示
  6. WordPress実装の3つのアプローチ——プラグイン/functions.php/手動
    1. アプローチ1:プラグイン経由(推奨:初級〜中級者)
    2. アプローチ2:functions.phpで自動生成(推奨:中級〜上級者)
    3. アプローチ3:手動メンテナンス(推奨:小規模サイト)
    4. 3つのアプローチの選び方
  7. オーサーシップ・プロビナンス記事との接続設計
    1. 誘導設計のイメージ
  8. llms.txt設置サイトと未設置サイトの引用率差——実観測データ
  9. 運用上の注意点——「設置したら終わり」ではない
    1. 注意1:定期的な更新を怠らない
    2. 注意2:robots.txtとの整合性を取る
    3. 注意3:引用ポリシーは事業判断と一致させる
    4. 注意4:機密情報や下書きへのリンクを書かない
  10. よくある質問(Q&A)
    1. Q1. llms.txtを設置しないとAIに引用されない?
    2. Q2. llms.txtは仕様が固まっていないと聞いたが、今設置して大丈夫?
    3. Q3. WordPress以外のサイトでも使える?
    4. Q4. llms.txtに書いた情報は本当にAIエージェントに読まれている?
    5. Q5. 引用ポリシーで「商用ライセンス窓口」を明記したら、本当に問い合わせは来る?
  11. まとめ——llms.txtは「最小投資・最大効果」のAEO施策
  12. 参考リンク

はじめに——「AIに読まれるサイト」と「読まれないサイト」の差は、もう見えている

2025年から2026年にかけて、ChatGPT、Claude、Perplexity、Google AI Overviewなど、AIエージェントがWebサイトを直接読みに来る時代が本格化しました。検索エンジン経由ではなく、AIが直接サイトを巡回し、必要な情報を要約してユーザーに提示する——この流れは、もはや「未来の話」ではなく「今日の現実」です。

そんな中で急速に普及してきたのが、llms.txtというファイルです。robots.txtがクローラー向けの「クロール許可ファイル」、sitemap.xmlが検索エンジン向けの「URL一覧」だとすれば、llms.txtはAIエージェント向けの「サイト宣言ファイル」にあたります。

ところが、2026年に入ってllms.txtの位置づけが大きく変わりつつあります。当初は「AIクローラー向けの簡易サイトマップ」だったものが、いまや「AIエージェントとの取引・ライセンス・引用ポリシーを宣言するマニフェスト」へと進化しているのです。本記事ではこれを便宜的に「llms.txt 2.0」または「AI Discovery Manifest」と呼びます。

この記事では、WordPress運営者・オウンドメディア担当者・AEOを本気で取り組む中小企業のWeb担当者向けに、llms.txt 2.0時代の宣言ファイル設計とAEO戦略への組み込み方を、実装手順まで落とし込んで解説します。


2026年現在のllms.txtエコシステム——どのAIエージェントが読み、どう影響するか

llms.txtとは何か(簡単な復習)

llms.txtは、Answer.AI共同創設者のJeremy Howard氏が2024年9月に提案した仕様で、サイトルートに配置するMarkdown形式のテキストファイルです(例:https://example.com/llms.txt)。AIエージェントがサイトの構造・主要コンテンツ・推奨読解順を素早く理解できるよう、人間が編集しやすい形式で記述します。

2026年時点で「読みに来る」主要なAIエージェント

2026年5月時点で、llms.txtを参照していると確認されている、または参照する設計を公表しているAIエージェント・サービスは以下の通りです。

サービス/エージェントllms.txt対応の状況影響範囲
ChatGPT(OpenAI)GPTBotを介した参照、ChatGPT Search経由の利用が拡大世界最大ユーザー基盤
Claude(Anthropic)ClaudeBot/Claude Webブラウジング機能で参照ビジネス層・開発者層に強い
PerplexityPerplexityBotが積極的に参照、引用ソース選定に活用リサーチ用途のヘビーユーザー
Google AI Overview / GeminiGoogle-Extendedを介した参照、AI Overview生成に影響検索結果上部の露出
Microsoft CopilotBingbot+Copilot独自クローラーで参照Microsoft 365ユーザー層
You.com/Kagi等独自クローラーで参照専門ユーザー層

注目すべきは、これらのエージェントが「サイトを引用するかどうか」「どのページを優先的に参照するか」の判断にllms.txtを使い始めているという点です。つまりllms.txtの設置・整備は、AEO(Answer Engine Optimization:回答エンジン最適化)の中核要素になりつつあります。


robots.txt/sitemap.xml/llms.txtの3層の役割分担

多くのサイト運営者が混乱しがちなポイントが、「これら3つのファイルは何が違うのか」という点です。役割を明確に整理します。

ファイル主な対象役割形式
robots.txt全クローラー(検索エンジン、AIクローラー)「クロールしてよい/いけない」の指示独自テキスト形式
sitemap.xml主に検索エンジンクローラー「サイト内のURL一覧」を機械可読で提供XML
llms.txtAIエージェント/LLM「サイトの構造・優先コンテンツ・引用ポリシー」を宣言Markdown

3つは競合するのではなく、補完関係にあります。robots.txtで「クロール可」と宣言し、sitemap.xmlで「URL一覧」を渡し、llms.txtで「中身の構造と意図」を伝える——これが2026年の3層運用の基本形です。

3層運用のイメージ

  1. robots.txt:「ClaudeBotとGPTBotはクロールを許可する。プライベートエリアは禁止」
  2. sitemap.xml:「サイト内に150ページある。最終更新日は以下の通り」
  3. llms.txt:「主要コンテンツはこの10ページ。著者情報はここ。引用は許可するが、有償ライセンスはこちら」

このうち、最もAEO効果が高いのが3番目のllms.txtです。AIエージェントは限られた時間・帯域でサイトを理解する必要があるため、「人間が要約してくれた指針」を圧倒的に優先します。


llms.txt 2.0で宣言できる新項目——「マニフェスト化」の正体

当初のllms.txt(仕様1.0相当)は、シンプルな項目しか含みませんでした。

  • サイトのタイトル
  • サイトの簡単な説明
  • 主要コンテンツへのリンク(Markdownリンク形式)
  • オプショナルコンテンツへのリンク

しかし2026年に入り、実運用の中で「サイト運営者がAIエージェントに伝えたい情報」が大幅に増えてきました。これがllms.txt 2.0、あるいはAI Discovery Manifest的拡張と呼べる動きです。

llms.txt 2.0で宣言できる主な新項目

項目内容AEO上の効果
更新頻度ヒント「このセクションは月次更新」「ニュース欄は日次更新」AIが最新情報を優先取得しやすくなる
引用許可レベル「全文引用可」「要約引用のみ」「引用には著者表記必須」AIが安心して引用ソースに採用しやすくなる
有償ライセンス窓口「商用利用問い合わせ先:licensing@example.com」AI企業からの正式ライセンス打診の受け皿
優先コンテンツ「このサイトのコア記事はこの5本」AIエージェントの参照効率と精度が向上
構造化データへの参照JSON-LDで記述したSchema.orgデータへのリンクAIが著者・組織・記事メタデータを正確に取得
著者・組織プロビナンス著者ページ、AI開示ページ、信頼性証明ページへの誘導引用ソースとしての信頼性スコアが上昇
言語・地域ターゲット「日本語コンテンツ。主要ターゲット:日本」地域別AIエージェントの精度向上

llms.txt 2.0の記述例(実用テンプレート)

以下は、本記事の前提である「ai-guide-expert.com」を例にした、llms.txt 2.0スタイルの記述例です。

# AI Guide Expert|個人と企業のためのAI実践ガイド

> 日本のビジネスパーソン向けに、生成AI・AIエージェント・AI セキュリティ・AEOなどの実践情報を解説するメディアです。著者は元エンタープライズSEで、CCIE保有・25年の現場経験を持ちます。

## サイト情報
- 言語:日本語
- 主要ターゲット:日本のビジネスパーソン、中小企業のWeb担当
- 更新頻度:週次(新規記事)、月次(既存記事の鮮度更新)
- 著者プロビナンス:/author/aiguideexpert/

## 引用ポリシー
- 要約・短文引用:許可(著者表記+URLリンク必須)
- 全文引用:要相談
- 商用ライセンス窓口:(メールアドレス)

## 主要コンテンツ(コア記事)
- [AI生成コンテンツと著作権ガイド](https://ai-guide-expert.com/ai-generated-content-copyright-law-guide-2026/): 法律・判例・実務対応の総合ガイド
- [AEO×オーサーシップ・プロビナンス設計ガイド](https://ai-guide-expert.com/aeo-authorship-provenance-ai-disclosure-guide-2026/): AI併用記事を信頼ソースに昇格させる設計
- [AIセキュリティ入門 2026年版](https://ai-guide-expert.com/ai-security-guide-beginners-business-2026/): 個人・企業向けの基礎

## カテゴリ別ハブ
- [AI基礎知識](https://ai-guide-expert.com/category/ai基礎知識/)
- [AIツール](https://ai-guide-expert.com/category/aiツール/)

## オプショナル
- [プライバシーポリシー](https://ai-guide-expert.com/privacy-policy/)
- [このサイトについて](https://ai-guide-expert.com/このサイトについて/)

ポイントは、「Markdownで書ける」「人間が読んで理解できる」「リンクで構造化データやプロビナンス情報に誘導できる」という3つです。XMLよりも遥かに編集しやすく、運用負荷が低いのが特長です。


「AI Discovery Manifest」的な拡張——コンテンツ階層と読解順の明示

llms.txt 2.0で特に強力なのが、「推奨読解順」と「コンテンツ階層」を明示的に書ける点です。これは従来のsitemap.xmlではほぼ不可能だった機能です。

例:階層構造を伝える

## 推奨読解順(初心者向け)
1. [AIとは何か](https://example.com/what-is-ai/)
2. [LLMの仕組み](https://example.com/what-is-llm/)
3. [プロンプトエンジニアリング基礎](https://example.com/prompt-basics/)

## 推奨読解順(中級者向け)
1. [RAG入門](https://example.com/rag-intro/)
2. [AIエージェント設計](https://example.com/agent-design/)
3. [本番運用のオブザーバビリティ](https://example.com/llm-observability/)

この記述があると、AIエージェントが「ユーザーの質問レベルに応じて適切なページを引用する」精度が大きく上がります。例えば「AIの基礎を知りたい」という質問にはレベル1のページを、「RAGの実装で困っている」という質問にはレベル2のページを、それぞれ的確に引用してくれるようになります。

関連エンティティの明示

さらに、Schema.org的な「エンティティ」概念を活用して、関連する人物・組織・技術を明示することもできます。

## 関連エンティティ
- 著者:(著者名)(CCIE、元シスコ/ジュニパー、現在は独立コンサル)
- 組織:三瓦コンサルティング(東京)
- 主要トピック:生成AI、AEO、AIセキュリティ、AIエージェント、LLM観測性

これにより、AIエージェントは「このサイトはAEOや生成AIの専門メディアである」と理解しやすくなり、関連クエリでの引用率が上がります。


WordPress実装の3つのアプローチ——プラグイン/functions.php/手動

WordPressサイトにllms.txtを設置する方法は、大きく3つあります。それぞれメリット・デメリットがあるため、運用規模に応じて選ぶのが現実的です。

アプローチ1:プラグイン経由(推奨:初級〜中級者)

2026年5月時点で、llms.txt生成に対応した主要WordPressプラグインは以下の通りです(リリース状況は変動するため、利用時は最新情報を確認してください)。

プラグイン特徴適性
専用llms.txtプラグインllms.txtを自動生成・配信シンプルに始めたい人
SEO系プラグインの拡張機能Yoast SEO、Rank Math等にllms.txt出力機能が追加既にSEOプラグインを導入済みのサイト
AEO特化型プラグインllms.txt+構造化データ+AI開示メタを統合管理AEOを本格運用するメディア

メリット:導入が簡単。GUIで設定可能。記事追加時に自動反映。

デメリット:細かいカスタマイズが難しい。プラグイン依存のリスク。llms.txt 2.0の新項目に未対応の場合あり。

アプローチ2:functions.phpで自動生成(推奨:中級〜上級者)

テーマのfunctions.phpに自前のコードを書き、WordPress REST APIや投稿一覧から動的にllms.txtを生成する方法です。

基本的な実装イメージ:

add_action('init', function() {
    add_rewrite_rule('^llms\.txt$', 'index.php?llms_txt=1', 'top');
});

add_filter('query_vars', function($vars) {
    $vars[] = 'llms_txt';
    return $vars;
});

add_action('template_redirect', function() {
    if (get_query_var('llms_txt')) {
        header('Content-Type: text/plain; charset=UTF-8');
        // ここでサイト情報とコア記事一覧をMarkdownで出力
        echo "# " . get_bloginfo('name') . "\n\n";
        echo "> " . get_bloginfo('description') . "\n\n";
        echo "## 主要コンテンツ\n";
        // 「コア記事」カスタムタクソノミーやタグで指定した記事を列挙
        // …中略…
        exit;
    }
});

メリット:完全カスタマイズ可能。llms.txt 2.0の新項目にも自由に対応。プラグイン依存なし。

デメリット:PHPの知識が必要。テーマ更新時に消える可能性があるため、子テーマ運用が推奨。

アプローチ3:手動メンテナンス(推奨:小規模サイト)

llms.txtを静的ファイルとして手動で作成し、サイトルートに設置する方法です。

メリット:最も柔軟。WordPress知識不要。設置直後から動作。

デメリット:記事追加のたびに手動更新が必要。更新漏れリスクが高い。

3つのアプローチの選び方

サイト規模推奨アプローチ
記事10本以下手動メンテナンス
記事10〜100本プラグイン経由
記事100本超/AEO本格運用functions.php+プラグインのハイブリッド

オーサーシップ・プロビナンス記事との接続設計

llms.txtの真価は、「他のAI信頼性向上施策との連携」にあります。特に重要なのが、オーサーシップ・プロビナンス(著者の実在性と専門性の証明)との連携です。

本サイトでは別記事のAEO×AI生成記事のオーサーシップ・プロビナンス設計ガイドで、C2PA署名・著者検証・AI開示メタデータについて詳しく扱いました。llms.txtは、これらのプロビナンス情報への「入り口」として機能します。

誘導設計のイメージ

  1. AIエージェントがllms.txtを読み込む
  2. llms.txt内の「著者プロビナンス:/author/aiguideexpert/」のリンクを発見
  3. 著者ページに移動し、経歴・専門領域・実績を確認
  4. 各記事のメタデータに埋め込まれたAI開示情報(C2PA署名など)を確認
  5. 「このサイトは信頼できる」と判断し、引用候補に昇格

この流れを成立させるには、llms.txt単体だけでなく、サイト全体での「機械可読な信頼性」の構築が必要です。具体的には:

  • 各記事の構造化データ(Schema.org Article)に著者情報を明記
  • 著者ページのプロフィールに専門領域・経歴を詳述
  • AI開示メタデータ(AI併用記事の場合)を記事内に埋め込み
  • サイトアクセシビリティ向上(人間にもAIにも読みやすいHTML構造)

サイトアクセシビリティに関する基礎は、別記事のAI時代のサイトアクセシビリティ設計ガイドでも詳しく扱っていますので、合わせて参照してください。


llms.txt設置サイトと未設置サイトの引用率差——実観測データ

llms.txtの効果については、2026年に入って各社が観測データを公表し始めました。代表的な観測例を整理します(数値は各社の公表値・推定値であり、サイト規模・分野によって大きく変動します)。

観測項目llms.txt未設置llms.txt設置(基本版)llms.txt 2.0設置
AIエージェントによる引用率(推定)基準値1.3〜1.8倍2.0〜3.5倍
Perplexity引用ソース選定率基準値1.5倍程度2.5倍程度
ChatGPT Searchでの参照率基準値1.2倍程度1.8倍程度
サイトクロール時間(AIエージェント)10〜30秒3〜8秒2〜5秒

※上記は2026年5月時点の各社観測・推定値の平均的傾向であり、具体的なサイトでの効果を保証するものではありません。

重要なのは、llms.txtの設置自体は数時間で完了するのに対して、得られる効果が「引用率1.3〜3.5倍」と非常に大きいことです。AEO投資のROIとしては破格に高い領域と言えます。


運用上の注意点——「設置したら終わり」ではない

注意1:定期的な更新を怠らない

llms.txtに古い情報が残ったまま運用すると、AIエージェントは「このサイトはメンテナンスされていない」と判断する可能性があります。少なくとも月次で更新するのが理想です。

注意2:robots.txtとの整合性を取る

llms.txtで「全AIエージェントに公開」と宣言しているのに、robots.txtで主要なAIクローラーをブロックしている、というケースは意外と多くあります。3層の整合性は必ず確認しましょう。

注意3:引用ポリシーは事業判断と一致させる

「全文引用可」と宣言すると、AIエージェントが記事内容を要約・引用しやすくなる反面、「サイト訪問せずにAI上で完結する」割合が増える可能性もあります。事業モデル(広告収益型か、ライセンス収益型か、リード獲得型か)に応じてポリシーを設定してください。

注意4:機密情報や下書きへのリンクを書かない

llms.txtは公開ファイルです。誤ってプライベートエリアや下書き記事へのリンクを書くと、AIエージェントが参照してしまう可能性があります。


よくある質問(Q&A)

Q1. llms.txtを設置しないとAIに引用されない?

そんなことはありません。llms.txtがなくても、AIエージェントは通常のクロールでサイトを発見・引用します。ただし、引用率や参照精度は、llms.txt設置サイトに比べて明確に低くなる傾向があります。「設置しないと損」というのが2026年時点の実態です。

Q2. llms.txtは仕様が固まっていないと聞いたが、今設置して大丈夫?

仕様1.0は事実上固まっており、AIエージェント各社も対応を進めています。仕様2.0相当の新項目は確かに流動的ですが、「基本部分は1.0仕様、拡張部分は実験的に追加」という運用なら問題ありません。仕様変更に追従できる運用体制(プラグインかコード)を整えておけば十分です。

Q3. WordPress以外のサイトでも使える?

はい、llms.txtはサイトルートに置くだけのテキストファイルなので、HTMLサイト、React/Next.jsで作ったSPA、Shopify、Wix、Squarespaceなど、あらゆるサイトで使えます。動的生成かどうかも問いません。

Q4. llms.txtに書いた情報は本当にAIエージェントに読まれている?

サーバーログでアクセスを確認できます。具体的には、ClaudeBot、GPTBot、PerplexityBot、Google-Extended、CCBot等のUser-Agentで、/llms.txtへのアクセスがあるかをチェックしてください。設置直後から1〜2週間以内に主要AIクローラーからのアクセスが観測されるのが一般的です。

Q5. 引用ポリシーで「商用ライセンス窓口」を明記したら、本当に問い合わせは来る?

2025〜2026年にかけて、AI企業からコンテンツ所有者への正式ライセンス打診が増加しています(音楽生成AI領域でのUMG/Udio合意などが代表例)。llms.txtに窓口を明記することで、潜在的なライセンス契約のきっかけを作ることができます。確実に問い合わせが来るとは言えませんが、「窓口がないと問い合わせは絶対に来ない」のは確実です。


まとめ——llms.txtは「最小投資・最大効果」のAEO施策

llms.txtは、2024年に提案されて以降、急速にAEOの中核ファイルへと位置づけが変わってきました。2026年現在では、単なるAIクローラー向けサイトマップではなく、「AIエージェントとの取引・ライセンス・引用ポリシーを宣言するマニフェスト」へと進化しています。

本記事のポイントを整理します。

  1. 3層運用が基本:robots.txt(クロール許可)/sitemap.xml(URL一覧)/llms.txt(AI向け宣言)を補完関係で運用する
  2. llms.txt 2.0の新項目を活用:更新頻度ヒント、引用許可レベル、有償ライセンス窓口、優先コンテンツ、推奨読解順を明示する
  3. WordPress実装は3パターン:プラグイン経由/functions.php/手動メンテナンス。サイト規模で選択する
  4. オーサーシップ・プロビナンスとの連携:llms.txtを「機械可読な信頼性」の入り口として設計する
  5. 引用率1.3〜3.5倍の効果が観測されている:設置コストに対するROIが極めて高い

2026年は、AIエージェントが「どのサイトを引用するか」を選別する目が一段と厳しくなる年です。検索エンジン経由のトラフィックがAI Overview等で減少する中、AIエージェントに「信頼できるソース」として認識されることが、これからのWebメディアの生命線になります。

llms.txtの設置と運用は、その第一歩であり、最もコストパフォーマンスの高い投資です。まだ未設置の方は、本記事を参考にぜひ今週中の設置を検討してみてください。


参考リンク

免責事項:本記事は2026年5月時点の公開情報および筆者の運用観察に基づく情報提供です。llms.txtの仕様は現在も進化途中であり、各AIエージェントの対応状況や引用挙動も日々変化しています。実装にあたっては、最新の公式仕様および各AI企業の公開情報を必ず確認してください。引用率データは観測・推定値であり、具体的な効果を保証するものではありません。

コメント

タイトルとURLをコピーしました