Upgrade to Pro — share decks privately, control downloads, hide ads and more …

チャットボットプロダクトにおけるリアルなNLP課題

 チャットボットプロダクトにおけるリアルなNLP課題

BCU30で登壇した資料です
https://bcu30.jp/2019/talk/tomomatsu-yuta/

tomomatsu_yuta

July 06, 2019
Tweet

More Decks by tomomatsu_yuta

Other Decks in Research

Transcript

  1. ⾃⼰紹介 名前︓ 友松 祐太(ともまつゆうた) 職種︓ データサイエンティスト 主な仕事︓ チャットボット のロジック開発/データビジュアライゼーション これまでの経歴︓

    • 2015/04(学部4年)-2017/03(修⼠1年) サイバーエージェントの研究組織であるAI Labとの共同研究に携わる サイバーエージェントに内定 • 2017/07(修⼠2年) - 内定者アルバイトという形でAIメッセンジャーで仕事を始める • 2018 サイバーエージェントに新卒⼊社 内定者時代から引き続きAIメッセンジャーに配属
  2. 初期設計 ⼈⼿ ⾃動 ⼈的コスト: ⼤ 技術コスト: ⼩ ⼈的コスト: ⼩ 技術コスト:

    ⼤ 顧客とCS(カスタマーサポート)のやりとりの記録からチャットボットが 答えるFAQを作成する
  3. 初期設計 ⼈⼿ ⾃動 ⼈的コスト: ⼤ 技術コスト: ⼩ ⼈的コスト: ⼩ 技術コスト:

    ⼤ 顧客とCS(カスタマーサポート)のやりとりの記録からチャットボットが 答えるFAQを作成する ⼀部を⾃動化し、残りの作業を⼈⼿で⾏う (例)問い合わせのクラスタリング • 重複する問い合わせをまとめられる • 件数から重要度がわかる 他にもクラスタ内の要約やキーフレーズ抽出などが 考えられる(できるだけ⾃動の部分を増やしたい)
  4. ログの汚染 メモ 不幸の⼿紙 ゲーム広告 ◦◦を⼀緒に遊ぼう! かんたんなパズルゲームだよ。 ▼ダウンロードはこちらから▼ https://〇〇/△ △ △

    今、〇〇本社がチェンメの危険性 を確かめる為、どこまで回るのか 検証中です。前回の嘘を⾒た〇〇 本社が、新しく作りました。もし よければ、このメッセージを20⼈ に回してください。もし、回して くれた場合、〇〇本社から1000コ イン、お好きな着せ替え1個をプレ ゼントします!ご協⼒お願いします。 せんぱいせんぱい! 今週の⽊曜⽇の夜って、お忙しいで すか? 提供するボットの機能と関係のない⼊⼒がされることがある 学習のノイズや、ボットの指標に悪影響なので、これらの問い合わせは除外したい →スパムフィルターの開発