Slide 1

Slide 1 text

color is クラウドLT⼤会vol.13 AI Agent時代なので AWSのLLMs.txtが欲しい! 2025/02/27

Slide 2

Slide 2 text

自己紹介 渡邉 洋平(watany) ● 所属:NTTテクノクロス株式会社 ○ 最近「AWS 500 APN Certification Distinction」に認定 ● Personal ○ JAWS-UG東京 運営 ○ AWS Ambassadors(2024) ○ Japan AWS All Certifications Engineers(2022~)

Slide 3

Slide 3 text

AI Agent時代なので AWSのLLMs.txtが欲しい! コレナニ?

Slide 4

Slide 4 text

世はまさに LLM-Agent時代 Computer use(Antropic) https://docs.anthropic.com/en/docs/agents-and-tools/c omputer-use Browser-use(OSS) https://github.com/browser-use/browser-use Deep Research(OpenAI等) https://openai.com/index/introducing-deep-research/ Agentが ブラウジング! Agentが 検索→推論→分 析! Agentが PC操作!

Slide 5

Slide 5 text

どうやって実現しているか? https://www.irasutoya.com/2016/04/blog-post_78.html

Slide 6

Slide 6 text

どうやって実現しているか?=アツいスクレイピング https://www.irasutoya.com/2019/03/blog-post_84.html https://www.irasutoya.com/2016/04/blog-post_78.html Agent! Go!

Slide 7

Slide 7 text

どうやって実現しているか?=アツいスクレイピング https://www.irasutoya.com/2019/03/blog-post_84.html https://www.irasutoya.com/2016/04/blog-post_78.html それって 良いの? Go! Go! Agent! Go!

Slide 8

Slide 8 text

あまり良くない https://www.irasutoya.com/2019/03/blog-post_84.html 認証対応 めんどくさ Botアクセス あかんか 人間用のマー クアップって 読みづらい 無駄に SSRし てサーバ動い てない? AIアクセス禁止だと 読まれなくなる? Botか?WAFで 弾いたろ https://www.irasutoya.com/2014/02/blog-post_2205.html

Slide 9

Slide 9 text

あまり良くない https://www.irasutoya.com/2019/03/blog-post_84.html 認証対応 めんどくさ Botアクセス あかんか 人間用のマー クアップって 読みづらい 無駄に SSRし てサーバ動い てない? AIアクセス禁止だと 読まれなくなる? Botか?WAFで 弾いたろ https://www.irasutoya.com/2014/02/blog-post_2205.html 誰も幸せになって いないのである

Slide 10

Slide 10 text

どうすればよかったか?

Slide 11

Slide 11 text

LLMs.txt

Slide 12

Slide 12 text

LLMs.txt ? LLM向けの課題を解決するための提案 ● /llms.txt ● Webページの構成をLLMに伝えるプレー ンなテキスト ● H1 から始める ● リンク集をMarkdown形式で列挙 ● 優先度低の項目はOptionalとして下 部に

Slide 13

Slide 13 text

LLMs.txt ? LLM向けの課題を解決するための提案 ● /llms-full.txt サイト情報をMarkdown形式で表す 完全なドキュメント 例:Honoの/llms-full.txt https://hono.dev//llms-full.txt

Slide 14

Slide 14 text

つまり https://www.irasutoya.com/2019/03/blog-post_84.html https://www.irasutoya.com/2014/02/blog-post_2205.html https://www.irasutoya.com/2020/11/blog-post_82.html 〇〇機能の 説明を探したい Overviewが 知りたい 公式ドキュメント を読みたい /llms.txt /llms-full.txt /

Slide 15

Slide 15 text

これと同じ説明を読んだが? 私がBlogの筆者なので。。。 https://zenn.dev/watany/articles/0b28a6 8a2dffc3 本登壇の準備として Zennに書いた記事

Slide 16

Slide 16 text

Appendix. 考察 なぜMarkdown? ● MarkupはLLMには過剰(
などの大量のタグ) ● SSR/ISRなどのユーザ体験は、Agentには不要 ● シンプルなテキストファイル+LLMの相性がいい ○ ex.NotebookLM

Slide 17

Slide 17 text

AI Agent時代なので AWSのLLMs.txtが欲しい! ちょっと わかった

Slide 18

Slide 18 text

AI Agent時代なので AWSのLLMs.txtが欲しい! これが欲しいの はなぜ?

Slide 19

Slide 19 text

LLMs.txt directory Cloudflareはある https://directory.llmstxt.cloud/llms.text

Slide 20

Slide 20 text

LLMs.txt directory AWS/Azure/GoogleCloudはない https://directory.llmstxt.cloud/llms.text

Slide 21

Slide 21 text

なぜAWSのLLMs.txt が欲しいか 前提:2025/02/25リリースのClaude 3.7、知識は2024/10まで まあ駄目だよね。 生成AIを活用してAWS 環境作っていいっすか? 4か月遅れの知識で https://www.irasutoya.com/2018/03/blog-post_778.html

Slide 22

Slide 22 text

なぜAWSのLLMs.txt が欲しいか バージョンロックがなくLatestしかないパブリッククラウドと、最新の知識を持たない LLMの相性はいまいち https://www.irasutoya.com/2016/04/blog-post_78.html https://www.irasutoya.com/2012/12/blog-post_6178.html それって 過渡期だけの 問題? しばらく同様 なのでは (個人見解 )

Slide 23

Slide 23 text

LLMs.txt があると? コンテキスト に入れば 助かるわ RAGのイン プットとしても 使いやすい Agent的にも 読みに行く 内容が明確 https://www.irasutoya.com/2012/12/blog-post_6178.html

Slide 24

Slide 24 text

実例:OSS(AWS CDK)

Slide 25

Slide 25 text

直接HTMLだとパースしづらい https://docs.aws.amazon.com/cdk/api/v2/docs/aws-cdk-lib-readme.html

Slide 26

Slide 26 text

OSSのドキュメントはどこ? https://github.com/aws/aws-cdk/blob/main/packages/aws-cdk-lib/aws-apigateway/README.md OSSはGitHubに 元テキストがある ことも多い

Slide 27

Slide 27 text

どうやって llms.txtを? 元ファイルがMarkdown形式なら、Scriptで組み立てられる 例:Honoのサイトは自動で組み立てている https://github.com/honojs/website/blob/main/scripts/build-llm-docs.ts

Slide 28

Slide 28 text

実例:AWS公式ドキュメント

Slide 29

Slide 29 text

直接HTMLだとパースしづらい 公式サイトはこんな構成 https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-bedrock.html

Slide 30

Slide 30 text

PDFでも読める …? https://docs.aws.amazon.com/bedrock/latest/userguide/what-is-bedrock.html

Slide 31

Slide 31 text

ClaudeでOCRできるらしい! Claudeモデルに「HTMLで再現して」と頼むといいらしい https://qiita.com/moritalous/items/f5afd052992afa40d524

Slide 32

Slide 32 text

RSSという手もある AWSのユーザドキュメントはRSS配信 もしている ここをうまいことParseするのも良さそう https://docs.aws.amazon.com/bedrock/latest/userguide/bedrock-ug.rss

Slide 33

Slide 33 text

実装は間に合わなかった! ごめんなさい🙇 ※たぶん難易度は高くない

Slide 34

Slide 34 text

まとめ ● LLMs.txtという概念がある。 ○ 規格は変わるかもだが、考え方を覚えておくと有用 ● AIに最新仕様を読ませる選択肢を思い浮かべられるようにしておこう ○ 来るべき生成AI開発時代へ…!

Slide 35

Slide 35 text

color is…? (おまけ) AI Agent時代なので AWSのLLMs.txtが欲しい! 文字色・吹き出し: #c0ffee 背景・吹き出し文字: 3f0011