Slide 1

Slide 1 text

機械学習で奇妙な冒険 @kanayannet Gunma.web #29

Slide 2

Slide 2 text

自己紹介 名前 : 金澤 宏昭 Twitter : @kanayannet Facebook : HiroakiKanazawa

Slide 3

Slide 3 text

機械学習と私 2011 年9 月 spam_ lter-druby---classi er- https://github.com/kanayannet/spam_ lter- druby---classi er-

Slide 4

Slide 4 text

おそらく まだ「機械学習」という言葉が流行ってなかった時代。

Slide 5

Slide 5 text

こっちの言葉の方が流行ってたかな? ベイズの定理 ベイジアンフィルター レコメンドエンジン

Slide 6

Slide 6 text

全部話すと大変 1 日じゃ終わらない。

Slide 7

Slide 7 text

今日話すこと なぜ話すのか? 機械学習の種類 奇妙な冒険 まずは動かしてみる 実験 まとめ

Slide 8

Slide 8 text

なぜ話すのか? 機械学習 という言葉が流行してから数年がたった。 web-db press でも扱われたし(8 月) そろそろ話してもい いかな?

Slide 9

Slide 9 text

機械学習の種類 アルゴリズムの分類 教師あり学習 教師なし学習 強化学習...etc

Slide 10

Slide 10 text

今日取り扱うもの 教師あり学習

Slide 11

Slide 11 text

理由 数年前作ったものを現在でも動くのか? 試したかった。 おそらく、動かない( 予想) 現代風に作り直すことである程度勉強になる

Slide 12

Slide 12 text

理由 教師なし学習.. 難しい!!>< 正直に言う、解らない!! 初心者でも解りそうな本あったら教えて!!

Slide 13

Slide 13 text

奇妙な冒険 JOJO の奇妙な冒険

Slide 14

Slide 14 text

なぜ? 名台詞がたくさんある!

Slide 15

Slide 15 text

何を学習させるの? 各キャラクターと名台詞

Slide 16

Slide 16 text

最終的に何をさせるの? 名台詞をIT 勉強会風に修正し どのキャラクターが言いそうな言葉か? 判定してもらう。

Slide 17

Slide 17 text

PG の構成 daemon.rb server 入力されたデータから学習し保存 入力されたデータから判定結果を返す mecab 形態要素解析 classi er ベイズの定理 を利用 Classi er::Bayes json/pure

Slide 18

Slide 18 text

json/pure 学習用データをjson 形式で保存する drb/drb 通信した別プロセスとobject 空間を共有

Slide 19

Slide 19 text

PG の構成 test_inp.rb client 入力された学習データをサーバに渡す 判定用文章をサーバに渡し、判定結果を出力 drb/drb 通信した別プロセスとobject 空間を共有

Slide 20

Slide 20 text

まずは動かしてみる その前に ざっくりと コードを見てもらいます。 細かいところは省く

Slide 21

Slide 21 text

学習させるデータ構造 { キャラキター名}{ セリフ} = true

Slide 22

Slide 22 text

今からIT 勉強会風に修正します デモ中....

Slide 23

Slide 23 text

実験 学習データを少なくすると、どうなるか? 擬音は判定できるの?

Slide 24

Slide 24 text

まとめ 学習データは少ないと精度が悪い 単純なパターンマッチよりも精度が悪い 特殊な擬音 例 辞書に追加するなり、チューニング必須

Slide 25

Slide 25 text

参考文献 https://docs.ruby-lang.org/ja/latest/library/drb.html http://d.hatena.ne.jp/zariganitosh/20070712/1184230093 https://qiita.com/mhiro216/items/391ae79848129ac1cb2d

Slide 26

Slide 26 text

余談 classi er classi er-reborn が出ている こっちの方がいいかも? mecab natto が出ている こっちの方がいいかも?

Slide 27

Slide 27 text

ガチな計算式 ベイズの定理 解りませんので、質問困る汗

Slide 28

Slide 28 text

ご清聴 ありがとうございました!