Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
machine-learn
Search
kanayannet
October 22, 2017
Programming
0
360
machine-learn
kanayannet
October 22, 2017
Tweet
Share
More Decks by kanayannet
See All by kanayannet
github copilot と 心理的安全性
kanayannet
0
130
FW と ライブラリ の考え方
kanayannet
0
180
TDDと今まで
kanayannet
0
510
個人開発 稼げなくてもいいアプリ
kanayannet
0
490
システムの堅牢性
kanayannet
0
260
Agile的学習方法
kanayannet
0
250
GUIをエンジニアが考える
kanayannet
0
220
http2http3
kanayannet
0
170
old typeからのクラウドインフラ
kanayannet
0
360
Other Decks in Programming
See All in Programming
CDK開発におけるコーディング規約の運用
yamanashi_ren01
2
260
Datadog Workflow Automation で圧倒的価値提供
showwin
1
300
Go 1.24でジェネリックになった型エイリアスの紹介
syumai
2
300
Serverless Rust: Your Low-Risk Entry Point to Rust in Production (and the benefits are huge)
lmammino
1
160
なぜイベント駆動が必要なのか - CQRS/ESで解く複雑系システムの課題 -
j5ik2o
14
4.8k
PRレビューのお供にDanger
stoticdev
1
240
AIレビュー導入によるCIツールとの共存と最適化
kamo26sima
1
200
.NET Frameworkでも汎用ホストが使いたい!
tomokusaba
0
200
color-scheme: light dark; を完全に理解する
uhyo
7
500
Kotlinの開発でも AIをいい感じに使いたい / Making the Most of AI in Kotlin Development
kohii00
5
1.8k
データベースのオペレーターであるCloudNativePGがStatefulSetを使わない理由に迫る
nnaka2992
0
250
もう僕は OpenAPI を書きたくない
sgash708
6
1.9k
Featured
See All Featured
Embracing the Ebb and Flow
colly
84
4.6k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
227
22k
Fashionably flexible responsive web design (full day workshop)
malarkey
406
66k
Git: the NoSQL Database
bkeepers
PRO
428
65k
Making Projects Easy
brettharned
116
6k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.5k
Writing Fast Ruby
sferik
628
61k
RailsConf 2023
tenderlove
29
1k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
4
440
Building Flexible Design Systems
yeseniaperezcruz
328
38k
Faster Mobile Websites
deanohume
306
31k
GitHub's CSS Performance
jonrohan
1030
460k
Transcript
機械学習で奇妙な冒険 @kanayannet Gunma.web #29
自己紹介 名前 : 金澤 宏昭 Twitter : @kanayannet Facebook :
HiroakiKanazawa
機械学習と私 2011 年9 月 spam_ lter-druby---classi er- https://github.com/kanayannet/spam_ lter- druby---classi
er-
おそらく まだ「機械学習」という言葉が流行ってなかった時代。
こっちの言葉の方が流行ってたかな? ベイズの定理 ベイジアンフィルター レコメンドエンジン
全部話すと大変 1 日じゃ終わらない。
今日話すこと なぜ話すのか? 機械学習の種類 奇妙な冒険 まずは動かしてみる 実験 まとめ
なぜ話すのか? 機械学習 という言葉が流行してから数年がたった。 web-db press でも扱われたし(8 月) そろそろ話してもい いかな?
機械学習の種類 アルゴリズムの分類 教師あり学習 教師なし学習 強化学習...etc
今日取り扱うもの 教師あり学習
理由 数年前作ったものを現在でも動くのか? 試したかった。 おそらく、動かない( 予想) 現代風に作り直すことである程度勉強になる
理由 教師なし学習.. 難しい!!>< 正直に言う、解らない!! 初心者でも解りそうな本あったら教えて!!
奇妙な冒険 JOJO の奇妙な冒険
なぜ? 名台詞がたくさんある!
何を学習させるの? 各キャラクターと名台詞
最終的に何をさせるの? 名台詞をIT 勉強会風に修正し どのキャラクターが言いそうな言葉か? 判定してもらう。
PG の構成 daemon.rb server 入力されたデータから学習し保存 入力されたデータから判定結果を返す mecab 形態要素解析 classi er
ベイズの定理 を利用 Classi er::Bayes json/pure
json/pure 学習用データをjson 形式で保存する drb/drb 通信した別プロセスとobject 空間を共有
PG の構成 test_inp.rb client 入力された学習データをサーバに渡す 判定用文章をサーバに渡し、判定結果を出力 drb/drb 通信した別プロセスとobject 空間を共有
まずは動かしてみる その前に ざっくりと コードを見てもらいます。 細かいところは省く
学習させるデータ構造 { キャラキター名}{ セリフ} = true
今からIT 勉強会風に修正します デモ中....
実験 学習データを少なくすると、どうなるか? 擬音は判定できるの?
まとめ 学習データは少ないと精度が悪い 単純なパターンマッチよりも精度が悪い 特殊な擬音 例 辞書に追加するなり、チューニング必須
参考文献 https://docs.ruby-lang.org/ja/latest/library/drb.html http://d.hatena.ne.jp/zariganitosh/20070712/1184230093 https://qiita.com/mhiro216/items/391ae79848129ac1cb2d
余談 classi er classi er-reborn が出ている こっちの方がいいかも? mecab natto が出ている
こっちの方がいいかも?
ガチな計算式 ベイズの定理 解りませんので、質問困る汗
ご清聴 ありがとうございました!