機械学習で奇妙な冒険@kanayannetGunma.web #29
View Slide
自己紹介名前 :金澤 宏昭Twitter : @kanayannetFacebook : HiroakiKanazawa
機械学習と私2011年9月spam_ lter-druby---classi er-https://github.com/kanayannet/spam_ lter-druby---classi er-
おそらくまだ「機械学習」という言葉が流行ってなかった時代。
こっちの言葉の方が流行ってたかな?ベイズの定理ベイジアンフィルターレコメンドエンジン
全部話すと大変1日じゃ終わらない。
今日話すことなぜ話すのか?機械学習の種類奇妙な冒険まずは動かしてみる実験まとめ
なぜ話すのか?機械学習 という言葉が流行してから数年がたった。web-db pressでも扱われたし(8月)そろそろ話してもいいかな?
機械学習の種類アルゴリズムの分類教師あり学習教師なし学習強化学習...etc
今日取り扱うもの教師あり学習
理由数年前作ったものを現在でも動くのか?試したかった。おそらく、動かない(予想)現代風に作り直すことである程度勉強になる
理由教師なし学習..難しい!!><正直に言う、解らない!!初心者でも解りそうな本あったら教えて!!
奇妙な冒険JOJOの奇妙な冒険
なぜ?名台詞がたくさんある!
何を学習させるの?各キャラクターと名台詞
最終的に何をさせるの?名台詞をIT勉強会風に修正しどのキャラクターが言いそうな言葉か?判定してもらう。
PGの構成daemon.rbserver入力されたデータから学習し保存入力されたデータから判定結果を返すmecab形態要素解析classi erベイズの定理 を利用Classi er::Bayesjson/pure
json/pure学習用データをjson形式で保存するdrb/drb通信した別プロセスとobject空間を共有
PGの構成test_inp.rbclient入力された学習データをサーバに渡す判定用文章をサーバに渡し、判定結果を出力drb/drb通信した別プロセスとobject空間を共有
まずは動かしてみるその前にざっくりと コードを見てもらいます。細かいところは省く
学習させるデータ構造{キャラキター名}{セリフ} = true
今からIT勉強会風に修正しますデモ中....
実験学習データを少なくすると、どうなるか?擬音は判定できるの?
まとめ学習データは少ないと精度が悪い単純なパターンマッチよりも精度が悪い特殊な擬音例辞書に追加するなり、チューニング必須
参考文献https://docs.ruby-lang.org/ja/latest/library/drb.htmlhttp://d.hatena.ne.jp/zariganitosh/20070712/1184230093https://qiita.com/mhiro216/items/391ae79848129ac1cb2d
余談classi erclassi er-rebornが出ているこっちの方がいいかも?mecabnattoが出ているこっちの方がいいかも?
ガチな計算式ベイズの定理解りませんので、質問困る汗
ご清聴ありがとうございました!