Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
machine-learn
Search
kanayannet
October 22, 2017
Programming
0
350
machine-learn
kanayannet
October 22, 2017
Tweet
Share
More Decks by kanayannet
See All by kanayannet
github copilot と 心理的安全性
kanayannet
0
120
FW と ライブラリ の考え方
kanayannet
0
180
TDDと今まで
kanayannet
0
500
個人開発 稼げなくてもいいアプリ
kanayannet
0
480
システムの堅牢性
kanayannet
0
260
Agile的学習方法
kanayannet
0
250
GUIをエンジニアが考える
kanayannet
0
210
http2http3
kanayannet
0
170
old typeからのクラウドインフラ
kanayannet
0
350
Other Decks in Programming
See All in Programming
AIプログラミング雑キャッチアップ
yuheinakasaka
17
4.2k
「個人開発マネタイズ大全」が教えてくれたこと
bani24884
1
180
Django NinjaによるAPI開発の効率化とリプレースの実践
kashewnuts
1
250
苦しいTiDBへの移行を乗り越えて快適な運用を目指す
leveragestech
0
1k
Jakarta EE meets AI
ivargrimstad
0
360
機能が複雑化しても 頼りになる FactoryBotの話
tamikof
0
110
技術を改善し続ける
gumioji
0
120
Boost Performance and Developer Productivity with Jakarta EE 11
ivargrimstad
0
790
データの整合性を保つ非同期処理アーキテクチャパターン / Async Architecture Patterns
mokuo
54
19k
Djangoアプリケーション 運用のリアル 〜問題発生から可視化、最適化への道〜 #pyconshizu
kashewnuts
1
260
Honoとフロントエンドの 型安全性について
yodaka
7
1.4k
バッチを作らなきゃとなったときに考えること
irof
2
520
Featured
See All Featured
Making Projects Easy
brettharned
116
6k
The Straight Up "How To Draw Better" Workshop
denniskardys
232
140k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
33
2.8k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
45
9.4k
GitHub's CSS Performance
jonrohan
1030
460k
Thoughts on Productivity
jonyablonski
69
4.5k
How to train your dragon (web standard)
notwaldorf
91
5.9k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Reflections from 52 weeks, 52 projects
jeffersonlam
348
20k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
47
5.2k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Build The Right Thing And Hit Your Dates
maggiecrowley
34
2.5k
Transcript
機械学習で奇妙な冒険 @kanayannet Gunma.web #29
自己紹介 名前 : 金澤 宏昭 Twitter : @kanayannet Facebook :
HiroakiKanazawa
機械学習と私 2011 年9 月 spam_ lter-druby---classi er- https://github.com/kanayannet/spam_ lter- druby---classi
er-
おそらく まだ「機械学習」という言葉が流行ってなかった時代。
こっちの言葉の方が流行ってたかな? ベイズの定理 ベイジアンフィルター レコメンドエンジン
全部話すと大変 1 日じゃ終わらない。
今日話すこと なぜ話すのか? 機械学習の種類 奇妙な冒険 まずは動かしてみる 実験 まとめ
なぜ話すのか? 機械学習 という言葉が流行してから数年がたった。 web-db press でも扱われたし(8 月) そろそろ話してもい いかな?
機械学習の種類 アルゴリズムの分類 教師あり学習 教師なし学習 強化学習...etc
今日取り扱うもの 教師あり学習
理由 数年前作ったものを現在でも動くのか? 試したかった。 おそらく、動かない( 予想) 現代風に作り直すことである程度勉強になる
理由 教師なし学習.. 難しい!!>< 正直に言う、解らない!! 初心者でも解りそうな本あったら教えて!!
奇妙な冒険 JOJO の奇妙な冒険
なぜ? 名台詞がたくさんある!
何を学習させるの? 各キャラクターと名台詞
最終的に何をさせるの? 名台詞をIT 勉強会風に修正し どのキャラクターが言いそうな言葉か? 判定してもらう。
PG の構成 daemon.rb server 入力されたデータから学習し保存 入力されたデータから判定結果を返す mecab 形態要素解析 classi er
ベイズの定理 を利用 Classi er::Bayes json/pure
json/pure 学習用データをjson 形式で保存する drb/drb 通信した別プロセスとobject 空間を共有
PG の構成 test_inp.rb client 入力された学習データをサーバに渡す 判定用文章をサーバに渡し、判定結果を出力 drb/drb 通信した別プロセスとobject 空間を共有
まずは動かしてみる その前に ざっくりと コードを見てもらいます。 細かいところは省く
学習させるデータ構造 { キャラキター名}{ セリフ} = true
今からIT 勉強会風に修正します デモ中....
実験 学習データを少なくすると、どうなるか? 擬音は判定できるの?
まとめ 学習データは少ないと精度が悪い 単純なパターンマッチよりも精度が悪い 特殊な擬音 例 辞書に追加するなり、チューニング必須
参考文献 https://docs.ruby-lang.org/ja/latest/library/drb.html http://d.hatena.ne.jp/zariganitosh/20070712/1184230093 https://qiita.com/mhiro216/items/391ae79848129ac1cb2d
余談 classi er classi er-reborn が出ている こっちの方がいいかも? mecab natto が出ている
こっちの方がいいかも?
ガチな計算式 ベイズの定理 解りませんので、質問困る汗
ご清聴 ありがとうございました!