Slide 1

Slide 1 text

LLM活用プロダクトを作るときに気をつけたこと 問題は小さく分けて、いい分析にはいいデータを NEWT Tech Talk vol.11 LLM時代に進化するプロダクト開発 ~最新の事例共有~ 1 2024/08/27 杉浦太樹 @futoiki

Slide 2

Slide 2 text

mento Inc. 自己紹介 新卒でリクルート入社後、データサイエンティストとして従 事。データ分析組織のマネージャーも担当。 2022年に株式会社mentoに参画。コーチング情報から取得さ れる動画・音声・テキスト情報に関する分析、データを中心 とした戦略策定を推進。 現在、大学院 博士課程にも在籍し機械学習に関する研究中。 (距離学習、情報幾何あたり) 好きなもの:SHIROBAKO, ハンドボール, ボードゲーム 杉浦 太樹 @futoiki データサイエンティスト + その他色々

Slide 3

Slide 3 text

mento Inc, 会社概要 株式会社mento 事業内容 コーチングプラットフォーム 代表者 木村憲仁 登録コーチ数 200名以上 累計セッション時間 50,000時間以上

Slide 4

Slide 4 text

mento Inc. 今日のテーマ 対話要約機能「AIサマリー」を 作るときに”具体的に”気をつけたこと

Slide 5

Slide 5 text

mento Inc. 今日持ち帰ってほしいこと 問題は小さく分けて いい分析にはいいデータを

Slide 6

Slide 6 text

mento Inc, 6 前提として コーチングって受けたことあります?

Slide 7

Slide 7 text

mento Inc. 7 コーチングとは クライアント(受講者)が望む状態を実現するために、 クライアント自身が考え行動することを支援する、コーチとの対話 1. 話すことで考えが整理される 2. アイデア・気づきが生まれる 3. 意志が決まる 4. 実行する

Slide 8

Slide 8 text

mento Inc. 8 コーチングとは クライアント(受講者)が望む状態を実現するために、 クライアント自身が考え行動することを支援する、コーチとの対話 1. 話すことで考えが整理される 2. アイデア・気づきが生まれる 3. 意志が決まる 4. 実行する 6ヶ月〜12ヶ月、利用いただくことが多い

Slide 9

Slide 9 text

mento Inc. コーチングのプロセスは白地で溢れてる セッション日 セッション日 セッション日 セッション日 セッション日 コーチングを継続的に受けているときの典型例

Slide 10

Slide 10 text

mento Inc. コーチングのプロセスは白地で溢れてる セッション日 セッション日 セッション日 セッション日 セッション日 コーチングを継続的に受けているときの典型例

Slide 11

Slide 11 text

mento Inc. コーチングのプロセスは白地で溢れてる セッション日 セッション日 セッション日 セッション日 セッション日 コーチングを継続的に受けているときの典型例 コーチングの内容、忘れちゃう!

Slide 12

Slide 12 text

mento Inc. コーチングのプロセスは白地で溢れてる ということで、日々の行動変容、次回のコーチングに向けて、 “負荷なく”、“適切な粒度で”、セッションを振り返ってもらいたい → AIサマリー ※パイプラインとかの話は今日は割愛

Slide 13

Slide 13 text

mento Inc. AIサマリーとは

Slide 14

Slide 14 text

mento Inc. AIサマリーとは

Slide 15

Slide 15 text

mento Inc. AIサマリーとは

Slide 16

Slide 16 text

mento Inc. HR テクノロジー大賞

Slide 17

Slide 17 text

mento Inc. AIサマリーとは 手間なく負荷なく、後で内容を思い出せるような要約を作成する ● 1時間のコーチングを通じた「タイトル」「キーワード」 ● 全体の流れがわかる「ピックアップ」 ● 次回のコーチングに向けた「ネクストアクション」

Slide 18

Slide 18 text

mento Inc. AIサマリーを作る シンプルに実装するなら、こんな感じ 録音データ 文字起こし 要約データ (AIサマリー)

Slide 19

Slide 19 text

mento Inc. 要約?割ともう普通に精度でるんじゃない?

Slide 20

Slide 20 text

mento Inc, 20 要約?割ともう普通に精度でるんじゃない? でない

Slide 21

Slide 21 text

mento Inc. 要約?割ともう普通に精度でるんじゃない?でない。

Slide 22

Slide 22 text

mento Inc. 要約?割ともう普通に精度でるんじゃない?でない。 ● 言ってもないことをLLMが勝手に... ● これは「私」が発言じゃなくて「コーチ」の発言 ● この粒度でほしいわけじゃない... ○ 自身のマネジメントの悩みを話した ● ていうか、そもそも文字起こしの精度が... ○ 部下とのワンワンで...

Slide 23

Slide 23 text

mento Inc. 何が起きているのか? 社内協力者のデータをもとに、何が起きているのか生データから手動で確認・検証

Slide 24

Slide 24 text

mento Inc. 何が起きているのか? 社内協力者のデータをもとに、何が起きているのか生データから手動で確認・検証

Slide 25

Slide 25 text

mento Inc. どう直していくのか? 録音データ 文字起こし 要約データ (AIサマリー) 機械学習のプロダクト実装の基本通り、愚直に解きました 「問題は小さく分けて、いい分析にはいいデータを」

Slide 26

Slide 26 text

mento Inc. どう直していくのか? 録音データ 文字起こし 要約データ (AIサマリー) 機械学習のプロダクト実装の基本通り、愚直に解きました 「問題は小さく分けて、いい分析にはいいデータを」 文字起こしの精度が低い ● 誤字が存在する ● 脱字が存在する ● 発話していない単語が存在する

Slide 27

Slide 27 text

mento Inc. どう直していくのか? 録音データ 文字起こし 要約データ (AIサマリー) 機械学習のプロダクト実装の基本通り、愚直に解きました 「問題は小さく分けて、いい分析にはいいデータを」 文字起こしの精度が低い ● 誤字が存在する ● 脱字が存在する ● 発話していない単語が存在する 要約結果の精度が低い ● 誤字が存在する ● 抽出したい内容が含まれていない ● 発言していない内容が含まれる ● 意味がある抽象度ではない ● フォーマットを守れていない

Slide 28

Slide 28 text

mento Inc. 文字起こしの精度について 誤字が存在 ● コーチングのデータに対して、複数のモデルを適用し検証 ○ Amazon transcribe/Gemini/Azure Speech to text/AmiVoice/Whipser(v2/v3)/… 脱字が存在 ● 話者が重なった場合に誤りが増えるケースが多い ● 音声認識問題の前提として、音声ファイルが分離されているケースの精度が良い ● そもそも録音時に、音声ファイルを話者分離できるサービスを利用 発言していない内容が存在 ● コーチングが1on1のため、話者分離されている場合、無音期間が長くなる ● 無音期間に対して、特定のモデルは文字起こしの精度が非常に不安定になる ○ 「ご視聴ありがとうございました」問題 ● 発話区間推定(Voice Activity Detection)を行い、発生部分のみを文字起こしを実施 ※もちろん精度以外の運用観点/法務観点も考慮し最終意思決定

Slide 29

Slide 29 text

mento Inc. どう直していくのか? 録音データ (音源分離済み) 文字起こし 要約データ (AIサマリー) 機械学習のプロダクト実装の基本通り、愚直に解きました 「問題は小さく分けて、いい分析にはいいデータを」 要約結果の精度が低い ● 誤字が存在する ● 抽出したい内容が含まれていない ● 発言していない内容が含まれる ● 意味がある抽象度ではない ● フォーマットを守れていない VAD

Slide 30

Slide 30 text

mento Inc. 要約の精度 誤字が存在 ● 誤字の中でも「人名」「専門用語」など一定のパターン化が可能なものは、個別の前処理で対応 抽出したい内容が含まれていない ● 文字起こし全体をいきなり要約させるのではなく段落分けから開始 発言していない内容が含まれる/意味がある抽象度ではない ● 要約を「キーワード特定」「ネクストアクション特定」「テーマ特定」の3タスクに分けて実施 フォーマットを守れていない ● Function calling/Structured Outputなどフォーマットをある程度固められるものを利用 ※もちろん精度以外の運用観点/法務観点も考慮し最終意思決定

Slide 31

Slide 31 text

mento Inc. どう直していくのか? 録音データ (音源分離済み) 文字起こし 要約データ (AIサマリー) 機械学習のプロダクト実装の基本通り、愚直に解きました 「問題は小さく分けて、いい分析にはいいデータを」 VAD 前 処 理 段 落 分 け タ ス ク 分 割 形 式 指 定

Slide 32

Slide 32 text

mento Inc. 補足 軽く試したけどうまくいかなかったので、もしいいアイデアあったら教えて下さい、なこと ● Whisperに対するprompting ○ トークン数少ない... ● 文字起こし自体のLLMによる修正 ○ 誤字脱字の修正 ○ 事前情報(プロフィールなど)に応じた修正 逆に、mentoでは試してないし、弊社の今のフェーズではやらないと決めていること ● 自社モデルの構築 ● Fine-tuning

Slide 33

Slide 33 text

mento Inc, 33 待って まだ終わりじゃない

Slide 34

Slide 34 text

mento Inc. リリースについて ● リリース基準となる精度は”定性評価”になりがち(=100%は無理) ○ 定性を定量評価に落とし込んで、基準を決める ● ToBなので一部の関係性の良いお客様から開始、社内の セールス/サクセス担当と事前に会話してから提供

Slide 35

Slide 35 text

mento Inc. AIサマリーではこのプロセスをもとに不確実性を下げ、開発/検証を繰り返しました かなり精度があがりました!セッショ ンを思い出すきっかけになります。 かなり精度が上がっている。文字面を追ってい くことでセッションを思い出すことができた。 精度高く要約されていたと思います。抽象度を 少し高くした要約はほぼ完璧だと思いました 誤字がいくつかあったが気にならないレベル。上記 同様、これ言ったっけな?はあるが、全体としてず れてないので許容範囲 ネクストアクション、今日のワードについては精度 があがったように思える。すべての項目で、コーチ ング全体からの網羅性は上がったように思える。

Slide 36

Slide 36 text

mento Inc. 今日のまとめ 問題は小さく分けて いい分析にはいいデータを

Slide 37

Slide 37 text

mento Inc. 今後の展望 ● 「AIサマリー」に限らず、今後は非構造化データに対する機能開発が進む ● 今後もLLM活用機能は事業の根幹として継続して開発 ● 本番プロダクト上で動かせている企業が増えてきた(けど、情報はまだ少ない) ● 今日はぜひいろいろと議論させてください!

Slide 38

Slide 38 text

mento Inc, 38 ついでに カジュアル面談やってます コーチングの話、組織の話 なんでも話しましょう! https://herp.careers/v1/mento/zgEhIVY4CLhN

Slide 39

Slide 39 text

Appendix.