教師あり学習を用いたSkillsの最適化

教師あり学習を用いたSkillsの最適化 Claude Code Meetup #5 2026/05/14 ＠Algomatic

自己紹介株式会社Algomatic AIエンジニア三上有祐情報の領域で修士号を取得後、新卒として株式会社AlgomaticにAIエンジニアとして入社。現在社会人2年目。業務エンタープライズ企業向けRAG/AIチャットボットの開発導入
プロダクト開発におけるAIエージェントの開発 AI駆動開発におけるデザインプロセスの効率化 X: @yusuke_post Claude Code Meetup #5 2026/05/14 ＠Algomatic

今回のテーマ今回のLTのテーマ X: @yusuke_post ＠Algomatic Claude Code Meetup #5 2026/05/14

本LTのテーマ Skillsを作業手順書として位置付け、複雑性の高い業務の自動化する際の評価を本LTのテーマとする Skills：複数のステップからなる複雑性のある業務を実現するための手順書エンジニア、非エンジニアの業務を問わず使用されている。今後もより広範囲、複雑性、専門性の高いことをすることが増えると想定。最適化・評価がより大切になる？ Claude Code Meetup #5
2026/05/14 ＠Algomatic

AnthropicのSkillを作るSkill AnthropicもSkillsの評価をしている Anthropic skill-creator Skillの作成テストケースの作成・評価まで評価基準を事前に設定し評価 +人間のFB https://claude.com/blog/improving-skill-creator- test-measure-and-refine-agent-skills
Claude Code Meetup #5 2026/05/14 ＠Algomatic

結論 HOWよりもWHAT WHY モデルがもっと賢くなると、「スキル＝仕様（what）」だけを書けば、具体的なやり方（how）はモデル側が自動で埋めてくれる世界になる https://claude.com/blog/improving-skill-creator- test-measure-and-refine-agent-skills 評価基準など、WHATの定義がより大事な時代、、、？
Claude Code Meetup #5 2026/05/14 ＠Algomatic

評価がより大事になる時代の課題 Claude Code Meetup #5 2026/05/14 ＠Algomatic

ASIS 解こうとしているタスクが高度になってきた、、専門家でないとFBが難しい時代？ 👦 非専門家 🧑‍🎓 専門家評価できるエンジニア、デザイナーなど高度な
AIの成果物評価できない Claude Code Meetup #5 2026/05/14 ＠Algomatic

TOBE像専門家でなくても、正しいFBを与えられるようにしたい 🤖 AI 評価できる高度な AIの成果物 👦 評価
できない非専門家 Claude Code Meetup #5 2026/05/14 ＠Algomatic

教師あり学習を用いた解決策の一例テストケースを作って、評価をしたいテストケース Rules& Skillsなど専門家のナレッジが入っている入力正解評価 Claude
Code Meetup #5 2026/05/14 ＠Algomatic

教師あり学習を用いた解決策の一例テストケースが作って、実際に実行して実力を見るテストケース入力例正解例専門家のナレッジが入っている成果物正解生成物＋ログ入力
Rules& Skills Evaluator 評価基準を元にミスについてFB Claude Code Meetup #5 2026/05/14 ＠Algomatic

実際に社内事例に応用する Claude Code Meetup #5 2026/05/14 ＠Algomatic

応用した社内事例デザイナーが行っていた既存プロダクトの新規機能の追加業務をClaude Codeで自動化する社内プロジェクトに応用要望理解 🧑‍🎨 実装 🧑‍🎨 AS-IS
新機能が追加されたモックアプリ要望 Claude Code Meetup #5 2026/05/14 ここを最適化したい要望理解 Skills& rules 実装 Skills& rules TO-BE 要望新機能が追加されたモックアプリ＠Algomatic

本事例において難しい点顧客の要望から、課題を適切に理解して、ソリューション（モックアプリ）に落とし込むこと AIにとって難しいタスク＝最適化が必要そう要望理解 🧑‍🎨 実装 🧑‍🎨 新機能が追加されたモックアプリ
要望 Claude Code Meetup #5 2026/05/14 ＠Algomatic

ステップ１: テスト用データセットの作成データセットを作成することで教師あり学習に近いものを実現する要望過去に社内のデザイナーが作ったFigmaモック〇〇したい〇〇したい〇〇いらない正解データ入力データ
Claude Code Meetup #5 2026/05/14 ＠Algomatic 1:1で対応

ステップ２：全体アーキテクチャデータセットを使用し、実行して改善をする入力生成物＋ログ正解要望既存プロダクトの実装評価基準 Evaluator
Rules& Skills 新機能が追加されたモックアプリ過去にデザイナーが作ったモックアプリ Claude Code Meetup #5 2026/05/14 ミスについてFBする＋最初は手動のFBも含む＠Algomatic

結果以下のようなフィードバックと解決策が得られた起こっている事象改善案(本来はもっと具体的で詳細) 改善例1 ユーザーの要望の裏にある意図が読めていない書かれたことをそのままではなく、裏の意図を理解する。改善例２要望に書かれていない属性や機
能を、AIが勝手に生成「ユーザーの要望の中で、応えなくていいところには応えない」という抑制を追加改善例3 既存のデザインシステムを使用していない Figma上のデザインシステムを積極的に活用する Claude Code Meetup #5 2026/05/14 ＠Algomatic

Before vs After 改善結果(うまくいった事例) Before 無駄な機能を実装してしまっている要望にあるテキストがそのまま使われてしまっている After
絵文字の使用方法が正しいレイアウト・情報の密度が正しい絵文字の多用コンポーネントの使用ができている Claude Code Meetup #5 2026/05/14 空白が多く、レイアウト・情報の密度がおかしい＠Algomatic

課題うまくいってそうに見えますが、課題が山積みです、、、課題詳細評価基準の設定が難しい評価の軸を正しく設定することが重要。コンテキストの管理が難しい実行時には正解データを見せないようにすることで、カンニング防止。トークン量が多い、時間コストが高い
テストケースが多く、トークンの使用量が多くなる。早く・安定して改善しない・むしろ悪化するケースが発生する Claude Code Meetup #5 2026/05/14 ＠Algomatic

まとめ・展望 Claude Code Meetup #5 2026/05/14 ＠Algomatic

まとめいろんな複雑な業務に応用されていくから、評価とか最適化が大事現状の課題の一つは「専門性の高い業務を自動化する際の、人によるFBの限界」解決できそうな一つの方法として、過去の成果物をテストケース化して実行・比較することで品質を担保することがある理論上はできそうだけど、まだ難しいところが多い Claude Code Meetup #5
2026/05/14 ＠Algomatic

展望今後行っていきたいこと多様な業務への応用学習方法の改善汎用化コンサル業務バックオフィス業務非エンジニア業務への適用学習時間・トークン使用量の改善強化学習などの概念の取り込み
フレームワーク化自由度の高いAIエージェントが民主化されたことで、比較的容易に複雑性の高いことが可能に Claude Code Meetup #5 2026/05/14 ＠Algomatic

ありがとうございました。 X: @yusuke_post このスライドを公開しています。株式会社Algomatic 採用してます! Claude Code Meetup
#5 2026/05/14 ＠Algomatic

教師あり学習を用いたSkillsの最適化

教師あり学習を用いたSkillsの最適化

Yusuke

Featured

Transcript