Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
チャットボットプロダクトにおけるリアルなNLP課題
Search
tomomatsu_yuta
July 06, 2019
Research
0
2.4k
チャットボットプロダクトにおけるリアルなNLP課題
BCU30で登壇した資料です
https://bcu30.jp/2019/talk/tomomatsu-yuta/
tomomatsu_yuta
July 06, 2019
Tweet
Share
More Decks by tomomatsu_yuta
See All by tomomatsu_yuta
〜LLM活用のリアルを語る〜 AI ShiftにおけるLLM活用
tomo_otamot
0
180
AIチャットボットのためのチューニング支援システム
tomo_otamot
0
790
組織にデータビジュアライゼーションを浸透させる
tomo_otamot
0
420
Other Decks in Research
See All in Research
精度を無視しない推薦多様化の評価指標
kuri8ive
1
370
PostgreSQLにおける分散トレーシングの現在 - 第50回PostgreSQLアンカンファレンス
seinoyu
0
260
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1.4k
言語モデルLUKEを経済の知識に特化させたモデル「UBKE-LUKE」について
petter0201
0
250
Neural Fieldの紹介
nnchiba
2
730
地理空間情報と自然言語処理:「地球の歩き方旅行記データセット」の高付加価値化を通じて
hiroki13
1
200
IM2024
mamoruk
0
230
アプリケーションから知るモデルマージ
maguro27
0
270
チュートリアル:Mamba, Vision Mamba (Vim)
hf149
6
2.2k
ECCV2024読み会: Minimalist Vision with Freeform Pixels
hsmtta
1
440
移動ビッグデータに基づく地理情報の埋め込みベクトル化
tam1110
0
250
Building Height Estimation Using Shadow Length in Satellite Imagery
satai
3
220
Featured
See All Featured
A Modern Web Designer's Workflow
chriscoyier
693
190k
個人開発の失敗を避けるイケてる考え方 / tips for indie hackers
panda_program
100
18k
Speed Design
sergeychernyshev
28
820
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
129
19k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
28
1.9k
Building a Scalable Design System with Sketch
lauravandoore
461
33k
Automating Front-end Workflow
addyosmani
1369
200k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
40
2k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
33
2.8k
Measuring & Analyzing Core Web Vitals
bluesmoon
6
270
[Rails World 2023 - Day 1 Closing Keynote] - The Magic of Rails
eileencodes
33
2.1k
Transcript
チャットボットプロダクト におけるリアルな NLP(⾃然⾔語処理) 課題 株式会社サイバーエージェント アドテク本部 AIメッセンジャーカンパニー 友松祐太
1.はじめに 2.AIメッセンジャーについて 3.チャットボット の運⽤における課題 4.まとめ
はじめに
⾃⼰紹介 名前︓ 友松 祐太(ともまつゆうた) 職種︓ データサイエンティスト 主な仕事︓ チャットボット のロジック開発/データビジュアライゼーション これまでの経歴︓
• 2015/04(学部4年)-2017/03(修⼠1年) サイバーエージェントの研究組織であるAI Labとの共同研究に携わる サイバーエージェントに内定 • 2017/07(修⼠2年) - 内定者アルバイトという形でAIメッセンジャーで仕事を始める • 2018 サイバーエージェントに新卒⼊社 内定者時代から引き続きAIメッセンジャーに配属
はじめに • チャットボットの開発/運⽤にあたり直⾯する様々なNLP(Natural Language Processing, ⾃然 ⾔語処理)の課題についてのお話しします • 時間的な制約があるので細かい話はAsk the
Speakerおよび懇親会の時間に聞いてください • 数式や具体的な機械学習⼿法の話は⾏いません。
AIメッセンジャーについて
AIメッセンジャーについて
AIメッセンジャーについて 経験豊富なAIコミュニケーション デザイナーがトータルサポート! [特徴] ①AIによる自動応答 ②有人切り替え可能 ③初期設計/運用/コンサルティングを提供 ⾼品質なチャットボットを提供
AIによるチャットボットの仕組み Question Answer ポイントはマイページ にて確認いただけます... 何ポイント貯まったか 確認したい FAQ
賢いチャットボットを作るために 賢い チャット ボット 賢いAI 質の⾼い FAQの整備
チャットボットの 運⽤における課題
チャットボット の運⽤プロセス
チャットボット の運⽤プロセス 初期設計
初期設計 ⼈⼿ ⾃動 ⼈的コスト: ⼤ 技術コスト: ⼩ ⼈的コスト: ⼩ 技術コスト:
⼤ 顧客とCS(カスタマーサポート)のやりとりの記録からチャットボットが 答えるFAQを作成する
初期設計 ⼈⼿ ⾃動 ⼈的コスト: ⼤ 技術コスト: ⼩ ⼈的コスト: ⼩ 技術コスト:
⼤ 顧客とCS(カスタマーサポート)のやりとりの記録からチャットボットが 答えるFAQを作成する ⼀部を⾃動化し、残りの作業を⼈⼿で⾏う (例)問い合わせのクラスタリング • 重複する問い合わせをまとめられる • 件数から重要度がわかる 他にもクラスタ内の要約やキーフレーズ抽出などが 考えられる(できるだけ⾃動の部分を増やしたい)
チャットボット の運⽤プロセス 実際の使われ⽅の確認
表記揺れ ユーザに⾃由⼊⼒を許す場合、ユーザは様々な表現で問い合わせてくる iphoneのデータ引き継ぎ iphone7のデータ引き継ぎ アイホンのデータ引き継ぎ アイフォーンのデータ引き継ぎ
表記揺れ 【解決法】 辞書に表記揺れのパターンを登録 【問題点】 1. 運⽤開始時に全ての表記揺れを把握することは不可能 運⽤しながら辞書を追加していく必要があり、⼈的コストがかかる 2. 顧客によって表記揺れとして扱うべきものが異なる iPhoneもAndroidも「スマホ」として扱っていい場合と分けて扱わなければならない場合がある
→顧客ごとに辞書を設定する必要がある 可能な限り辞書作成を⾃動化したい & 表記揺れに強いモデルを適⽤したい
チャットボット の運⽤プロセス FAQの再設計
FAQの改善 利⽤ログにはどういう問い合わせに対して何の回答を提案し、それが参照されたか が記録されている 利⽤ログ 提⽰した回答が参照されなかった原因を分析 1. 回答候補に適切なものが無い →対応するFAQの作成 2. 新商品などの新語
→表記揺れ辞書の追加 3. 正しい回答は提⽰できているが正しいと認識されていない →提⽰⽂⾔の修正(次ページ)
提⽰⽂⾔の修正 下記の中に近い問題はありますか︖ マイページの開き⽅ ログイン⽅法 ・・・ ・・・ このサイトではログインするとマイページが開くので、提⽰した回答で解決できる しかし「ログイン=マイページを開く」と認識できていないユーザーもいるため マイページへのログイン⽅法 ログイン⽅法
マイページの開き⽅ と修正するか のようにユーザの発話に合わせて2種類の⽂⾔を提⽰するなど、 回答⽂⾔を⼯夫する必要がある
ログの汚染 メモ 不幸の⼿紙 ゲーム広告 ◦◦を⼀緒に遊ぼう! かんたんなパズルゲームだよ。 ▼ダウンロードはこちらから▼ https://〇〇/△ △ △
今、〇〇本社がチェンメの危険性 を確かめる為、どこまで回るのか 検証中です。前回の嘘を⾒た〇〇 本社が、新しく作りました。もし よければ、このメッセージを20⼈ に回してください。もし、回して くれた場合、〇〇本社から1000コ イン、お好きな着せ替え1個をプレ ゼントします!ご協⼒お願いします。 せんぱいせんぱい! 今週の⽊曜⽇の夜って、お忙しいで すか? 提供するボットの機能と関係のない⼊⼒がされることがある 学習のノイズや、ボットの指標に悪影響なので、これらの問い合わせは除外したい →スパムフィルターの開発
まとめ
まとめ • AIチャットボット の精度向上には「AIの賢さ」に加えて「質の⾼いFAQの整備」が不可⽋ • 実プロダクトにおいてNLPや機械学習の利⽤価値は無限⼤ • アカデミックとはまた違った実プロダクトならではの課題がたくさんある。 続きはAsk the
Speakerと懇親会で話しましょう︕
ご静聴ありがとうございました