$30 off During Our Annual Pro Sale. View Details »

新たな学習体験を作り、ユーザーの学習を支援するAIエージェント開発への挑戦

 新たな学習体験を作り、ユーザーの学習を支援するAIエージェント開発への挑戦

12/10(水)AIエージェント実装の壁と突破口〜プロダクト実装の実践知〜での発表内容です。
グロービスがAIエージェントを実装したうえでの難所や取り組みについて田邊がプレゼンテーションを実施しました。

Avatar for GLOBIS Digital Platform

GLOBIS Digital Platform PRO

December 14, 2025
Tweet

More Decks by GLOBIS Digital Platform

Transcript

  1. 田邊健也 / Tanabe Tatsuya シニア機械学習エンジニア@グロービス株式会社 東京大学 計数工学科卒 SNSのデータから行列分解を用いたトピック検出を行う手法について卒業研 究を行なった。 AIベンダーなどで

    画像認識系のモデルを用いたソリューション開発を行うエ ンジニアのキャリアを経て、2022年3月にグロービスに入社。 主に学習コンテンツのレコメンドシステムの開発・運用を担当。 最近では LLMを事業に活用するための開発や実験などにも取り組んでいま す。 趣味はチェロを弾くこと。 自己紹介
  2. ユーザーの学習に対するの3つの課題 1. 理解・定着の課題 : 「わからない」「理解が十分できていない」 2. 実践応用の課題 : 「自分の仕事にどう活かせばいいかわからない」 3.

    モチベーションの課題 :「学習が続かない」 ユーザーの学習に関する課題 ユーザーひとり一人がこれらの課題を乗り越え、学習効果を最大化できる よう、AIが支援し伴走する学習体験を提供できないか
  3. 学びエージェント 7 • 「GLOBIS 学び放題」ユーザーの学習の全行程を支 援するパーソナル AIアシスタント • 学習効果の最大化 とモチベーションの維持

    を サポートする • 2025/11に第一段として、動画学習における理解と 実践力を高めるための支援を行う、対話型チャット 機能をリリース 詳細については下記プレスリリースをぜひご覧ください https://prtimes.jp/main/html/rd/p/000000196.000052928.html
  4. ワークフローによるタスク分解 ワークフローを構 成する タスクをそれ ぞれ個別に捉えて 開発に集中するこ とができ、デバッグも 容 易 になる。

    分類タスクなどは定量評価が可能に なり、指標に基づいた客観的な改善 が可能になる。 タスクの結果に応じ動的にコンテキ ストを連携できるようになり、より柔 軟で高精度な回答を生成できるよう に。 機能のモジュール化によって、 細かい要件に沿った 機能の追加・変 更が容易に ワークフロー化によってもたらされる主なメリット 1. 開発効率と保守性の向上 2. 信頼性と精度の 担保 3. 拡張性の確保
  5. リリース後、データに基づいた継続的な改善をいかに適切に、効率良く行っていくかが鍵となる 今後の運用における課題と展望 会話ログ・ユーザーフィードバックの活用 : AIエージェントとの会話ログやポジネガフィードバックを収集・分析し、改善点を特定。 検証データセットの拡充 : 実際のユーザー入力に基づき、評価の基準となるデータセットを継続的にアップデート。 定性評価の定量化 :

    リリースまでのスピード重視のフェーズでは少人数の定性評価メインでやっていたが、ここも客観的な評価を行えるよう、 LLM-as-a-judgeなどの手法も活用し、定量的な評価を行えるようアップデートすることを目指したい。 評価の仕組みの自動化と効率化にも繋げていきたい。 トレーシングの重要性 : ワークフローが拡張される未来も見据え、LangSmithのようなトレーシングツールの導入し、監視機能も強化する。 定性的にアウトプットを確認することも一定の割合で継続していけるように。
  6. AIエージェント開発で得た 3つの実践知 まとめ 複雑な要件は、単純なタスクに分解 し、ワークフローを構成することで、 開発効率・品質・拡張性を高められ る。 定量評価可能な所はちゃんとデータ を集め、定量評価できるようにする。 結果的にそれが改善への最短ルー

    トになり、ドメイン固有の価値にも繋 がる。 初期は定性評価メインでスピードを 重視し、リリース後はフィードバック データなどを活用した定量評価の割 合を増やして改善の起点とし、品質 をスケールさせていく。 1. 要件を主要なタスクに分解 2.定量評価をちゃんとやる 3. フェーズに応じた評価戦略