Upgrade to Pro — share decks privately, control downloads, hide ads and more …

プロダクト体験向上のためのLLMの活用

Avatar for nersonu nersonu
February 05, 2025

 プロダクト体験向上のためのLLMの活用

■ イベント
渋谷 Biz × AI: ビジネスにおける AI 利活用 事例勉強会 (2025/02/05)
https://sansan.connpass.com/event/340727/

「プロダクト体験向上のためのLLMの活用」というタイトルで、機械学習 / AI のプロダクトへの適用についてお気持ちを話しました。

Avatar for nersonu

nersonu

February 05, 2025
Tweet

Other Decks in Technology

Transcript

  1. 自己紹介 青見 樹 / Aomi Itsuki 株式会社サイバーエージェント AI事業本部 協業リテールメディア Div.

    機械学習エンジニア Sansan (2021.04 - 2023.10) ↓ サイバーエージェント (2023.11-) @nersonu nersonu
  2. 思いつく課題 ・仮に LLM にやらせたとしたら、ハルシネーションや単に性能面での 品質は問題ないか? ・解釈って?その定義は?ユーザーは 機械学習 (ML) / AI

    の出力に何 を求める? ・そもそも、どこを分解、どこを input / output にして目の前の問題 を解きますか?
  3. うまくいかない例 ハルシネーションに限らず、いくら prompt を工夫しても生成モデル は100%期待通りの出力をするとは限らない ※出力は可能な限り手で再現したものです 全体の売上は x,xxx,xxx,xxx 円とな り、前週より

    xx.xx % 増加する結果と なりました。
 x月の売上から、xxx.x 百万円の着 地予想であり、前年同月比で xx % 減と減収傾向にあります。
 単位の表記が揃わない、コ ンマがあったりなかったり 小数点の位置が揃わない、百 分率を変換前変換後 (100をか けた後か前なのか) の解釈を ミスする そもそも使ってほしい数値が 出力されてない
  4. LLM にやってもらうならどうするか? 補助ツールとしてはともかく、LLM によって自動出力されたアウト プットをそのまま利用できるかは精度要件との相談 (e.g. SQL の自動生成等を考えてみよう) 全体的にダウントレンドに 見えるが……

    データの系列 をLLMへ 数量は全体的に増加傾 向にあります。
 局所的な上がり幅だけを生 成に利用してしまうことも ※出力は可能な限り手で再現したものです
  5. LLM にやってもらうならどうするか? 精度要件に問題がないなら、この場合元の系列そのものを「単純化」 することを考える → 線形近似した系列を LLM の input とする

    線形近似後の 系列をLLMへ 数量は減少傾向にあり ます。
 もちろん、全てでうまくい くわけではないことに注意 ※出力は可能な限り手で再現したものです
  6. 方法そのものでの工夫 ・モデルに手を加えない研究の多くは、LLM の prompting 等で特定 タスクの性能を向上させるもの。その中でのステップも一種の問題の 簡易化と捉えることができるものも多い ・例えば、分析を LLM にやらせるものとして関連があるもの

    → 表解釈をうまくやる方法 (e.g. Chain-of-Table (Wang et al., ICLR 2024)) CyberAgent Developers Blog に少しまとめてますので興味あれば🙏: LLM に表データを読み解かせたかったので、ちょっと試してみた | CyberAgent Developers Blog → 画像を入力させるほうがうまくいく報告 (e.g. Daswani et al., arXiv 2024)
  7. LLM の出力を整える ・所詮 output は自然言語である → 頻出する既知のミスパターンを可能な限り網羅できるように、 出力に対する正規表現の変換でミスを減らす → ”Structured

    Output” のような、構造的なデータ形式に出力 を調整して、出力物そのものがユーザに見えない処理をさせる ・LLM as a Judge を LLM の出力に利用して、その評価を利用して出 力を再生成させることもできる
  8. おわりに 機械学習 (ML) / AI のアウトプットは体験とセット 体験をしっかりと設計して 何をやってもらうか / やってもらわないかを考えたい

    LLM の性能が日々進化し、「やってもらえることが増えている」と感 じており、常にアップデートしていきたいと思っています!
  9. EOF