Slide 18
Slide 18 text
産総研, 『機械学習品質マネジメントガイドライン 第4版』, 2023
AIプロダクト品質保証コンソーシアム (QA4AI), 『AIプロダクト品質保証ガイドライン 2024.04版』, 2024
経済産業省, 『AI事業者ガイドライン 第1.0版』, 2024
佐藤氏, 小川氏, 來間氏, 明神氏, 『AIソフトウェアのテスト -- 答えのない答え合わせ [4つの手法]』, AI/Data Science実務選書, 2021
Christopher Noessel氏, 『Designing Agentive Technology. AI That Works for People』, 2017
Akihiro Ueno氏, 『LLMによるLLMの評価「LLM-as-a-Judge」入門〜基礎から運用まで徹底解説』, PharmaXテックブログ, 2024
Jeffrey Ip氏, 『LLM Testing in 2025: Top Methods and Strategies』, Confident AI Blog, 2025
Ito氏, Ogawa氏, Onabuta氏 (Microsoft), 『Step-by-Step MLOps and Microsoft Products』, 2024
辻氏 (AWS), 『機械学習ソフトウェアにおけるテスト手法』, 第36回MLOps勉強会, 2023
Citadel AI, 『Eval-Centric AI: 生成AI時代の新たなフレームワーク』, Citadel AI Blog, 2025
seya氏, 『自動化するLLMシステムの品質管理: LLM-as-a-judge の作り方』, Gaudiy Tech Blog, 2024
Susumu Tokumoto氏, 『機械学習システムのためのメタモルフィックテスティング入門』, Qiita, 2018
nogawanogawa氏, 『RAGにおけるMetrics-Driven Developmentを調べる』, (Blog) Re:ゼロから始めるML生活, 2024
https://www.digiarc.aist.go.jp/publication/aiqm/guideline-rev4.html
https://github.com/qa4ai/Guidelines/blob/main/QA4AI_Guideline.202404.pdf
https://www.meti.go.jp/shingikai/mono_info_service/ai_shakai_jisso/20240419_report.html
https://amzn.asia/d/cs5KrW8
https://a.co/d/4Qj1ss9
https://zenn.dev/pharmax/articles/2d07bf0498e212
https://www.confident-ai.com/blog/llm-testing-in-2024-top-methods-and-strategies
https://speakerdeck.com/shisyu_gaku/step-by-step-mlops-and-microsoft-products
https://speakerdeck.com/hitsuji1991/ml-software-test-metamorphic
https://zenn.dev/asei/articles/vertex-ai-genai-evaluation
https://techblog.gaudiy.com/entry/2024/10/22/105609
https://qiita.com/tokumoto/items/cd3d17cae3b099badaf6
https://www.nogawanogawa.com/entry/metrics_driven_development
18 本資料を読む前に参照されたい資料 追加資料