チャットボット奮闘記

チャットボット奮闘記 1

⽬的 2 早起きして有意義な時間を過ごせた！アップルのCEOみたいやな、それが続けば将来成功するわ今⽇初めて、先輩に褒められたよ！おめでとう。千⾥の道も⼀歩から。明⽇からも頑張りや〜
褒める返答をするチャットボットを作りたいチャットボット

実現⽅法 3 2. 褒める返答を学習して、⼈⼯知能が⼊⼒に対して返答を⾏う 1. ⼀般的な対話を学習して、それに対する返答と褒める⽂章のベクトルを組み合わせて褒める⽂章を⽣成する (画像⽣成のGANみたいなイメージ) 難しすぎる（研究レベル) 学習データがあれば今まで研究されてきた
対話モデルとか使えばなんとかなりそう参考サイト: http://qiita.com/sergeant-wizard/items/0a57485bc90a35efcf26

学習モデル 4 Seq2Seq 多層ニューラルネットワーク LSTM リカレントニューラルネットワーク(RNN) ここ Seq2Seq+LSTM

RNNの例語彙: [h, e, l, o] トレーニング⽂章: “hello” 1 0
0 0 0 1 0 0 0 0 1 0 0 0 0 1 “h” “e” “l” “l” ⼊⼒データ t 1 2 3 4 ⼊⼒層: X 5

RNNの例語彙: [h, e, l, o] トレーニング⽂章: “hello” 1 0
0 0 0 1 0 0 0 0 1 0 0 0 0 1 0.3 -0.1 0.9 1.0 0.3 0.1 0.1 -0.5 -0.3 -0.3 0.9 0.7 “h” “e” “l” “l” ⼊⼒データ W W(in) zt = tanh(W(in)xt +Wzt−1) t 1 2 3 4 隠れ層: Z ⼊⼒層: X 6

RNNの例語彙: [h, e, l, o] トレーニング⽂章: “hello” 出⼒層: Y
隠れ層: Z ⼊⼒層: X 1 0 0 0 0 1 0 0 0 0 1 0 0 0 0 1 0.3 -0.1 0.9 1.0 0.3 0.1 0.1 -0.5 -0.3 -0.3 0.9 0.7 1.0 2.2 -3.0 4.1 0.5 0.3 -1.0 1.2 0.1 0.5 1.9 -1.1 0.2 -1.5 -0.1 2.2 “h” “e” “l” “l” 教師データ “e” “l” “l” “o” ⼊⼒データ W(out) W W(in) 学習 t 1 2 3 4 7

one to many many to one RNNの種類例: image caption
出⼒層隠れ層⼊⼒層画像⼊⼒を CNNを通して最初に⾏い、単語ベクトルと画像の空間に埋め込んでいく例: 感情解析⽂章 -> 感情画像 -> 画像の説明⽂ 8

RNNの種類 many to many many to many 出⼒層隠れ層⼊⼒層
例: 機械翻訳⽂章 -> 翻訳された⽂章例: フレームレベルでのビデオ分類フレームごとの画像 -> 分類 9

LSTM × × × i t o t c t
f t x t x t x t x t h t h t−1 h t−1 h t−1 h t−1 ⼊⼒ゲート出⼒ゲート忘却ゲートメモリセル 10

⼊⼒ゲート⽂中で離れた単語iと単語j の間の依存関係を維持したい単語iによって活性化した隠れ層のある次元hを単語jが⼊⼒されるまで依存関係を持たない他の単語kが⼊⼒されても活性化状態を維持したい単語kが⼊⼒の影響を受けないようにするために次元hに流⼊する全結合の重みを0に設定すると単語iも単語jも認識できなくなる
⼊⼒ゲートの開閉で必要な誤差伝搬だけを伝搬するようにする 11

出⼒ゲート依存関係のない単語kの出⼒を受け取らないようにするために出⼒を0にすると単語iも単語j も認識できなくなる出⼒ゲートの開閉で必要な 12

忘却ゲート初期のLSTMには存在しなかったゲート話題の変化などで過去の⽂脈が無⽤になったときに、その⽂脈の影響を受けたくない初期のLSTMは過去に出現した単語を際限なく記憶し続ける忘却ゲートの状態遷移で不要になった過去の⽂脈を
捨てられる 13

Seq2Seq ？どうは <EOS> かなり良いですねかなり
良いですね <EOS> 14 気分⽂の終わりを⽰す

15 LSTM LSTM LSTM LSTM LSTM LSTM LSTM LSTM ？
どうは <EOS> かなり良いですねかなり良いですね <EOS> LSTM 気分 Embed Embed Embed Embed Embed Embed Embed Embed Embed Seq2Seq+LSTM Onehot Onehot Onehot Onehot Onehot Onehot Onehot Onehot Onehot Softmax Softmax Softmax Softmax Softmax ⼊⼒を逆にすると上⼿くいくと⾔われている（理由は証明されていない)

実装 16 l Chainerで実装 l ⼆つのモデルを作って試してみた 1. Embed(単語の分散表現)もrnn上で学習 2. Embed(単語の分散表現)を事前にword2vecで学習したものを使⽤
参考⽂献ソースコード: https://github.com/Hiroki6/homey_api 実装したモデル

単語の分散表現 17 単語の意味を低次元の密な実数値ベクトルで表現したもの。 Word2Vec ・「王様」- 「男」+ 「⼥」= 「⼥王」・「パリ」- 「フランス」+
「⽇本」= 「東京」 one-hotベクトル Embed 単語の意味はその周辺単語の分布により知ることができる周辺単語の分布を表す共起単語の出現分布をベクトルで表現

Word2Vec 18 from gensim.models.word2vec import Word2Vec model = Word2Vec.load(w2v_model_path) #
モデルの読み込み # 王+⼥-男 results = w2v.most_similar(positive=[u"王", u"⼥"], negative=[u"男"], topn=20) 聖王, 0.809992 君主, 0.802966 皇帝, 0.801212 ⼥帝, 0.787127 先王, 0.782204 王⼦, 0.772441 王シ, 0.771339 ⼤王, 0.763460 公, 0.762177 ローマ皇帝, 0.760930 ⼥王, 0.759142 ⽩ヤギコーポレーションが公開している学習済みword2vecのモデルを使⽤ http://aial.shiroyagi.co.jp/2017/02/japanese-word2vec-model-builder/ gensimで簡単に読み込んで使⽤できる

学習 19 chainerは簡単にgpu環境で動かせる関数を⽤意している import numpy as np from chainer import
cuda xp = cuda.cupy # npの代わりにxpを使⽤ cuda.get_device(0).use() # 使⽤するGPUを指定 model.to_gpu() # modelを学習するまえにgpu⽤に変換 Ø GPUを使⽤(Tesla) この3⾏を加えるだけ環境時間褒める会話を多く含む11,000対話を100epoch学習約1週間

学習結果 20 1. Embed(単語の分散表現)もrnn上で学習割と会話っぽくなる全く学習が上⼿くいかなかった⼊⼒出⼒⼊⼒出⼒
2. Embed(単語の分散表現)を事前に word2vecで学習したものを使⽤今⽇先輩に褒められたあなたは良かったですね穏やかなところもあるのかなと思いますやっぱり僕ら僕らG10G10 G10G10G10G10G10G10G10 今⽇先輩に褒められたわかります、とても幸せと思います早起きして有意義な時間を過ごせた早起きして有意義な時間を過ごせたわたしお話わたしいつかあなたいつかあなた⼤切な⼈ハッピーBEDIGITALDIGITA LDIGITAL いいですね良かったですよねお年寄りに席を譲ったよお年寄りに席を譲ったよあいつ夢にあたしあいつハッピーBEDIGITALDIGITAL DIGITALWaveWaveDIGITAL

チャットボット 21 GPUを搭載したマシンモデルの学習 AWSサーバー(無料インスタンス) 学習したモデルを使⽤して予測リクエスト
返答モデルをファイル形式で転送 Embed(単語の分散表現)もrnnで100epoch学習したモデルをAPI化

まとめ 22 l ディープラーニングはコストが⾼い l ⼤量の学習データ l 計算機(GPUなど) l 研究レベルと実⽤レベルは違う
l 研究だと⽂章っぽくなってても感動する l 実⽤だとちゃんとした⽂章が求められる l ディープラーニングは難しい l 細かいチューニング l パラメータが多い l 計算コスト l どの部分が有効かがわかりにくい

チャットボット奮闘記

チャットボット奮闘記

fuzyco

More Decks by fuzyco

Other Decks in Technology

Featured

Transcript