Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
machine-learn
Search
kanayannet
October 22, 2017
Programming
0
390
machine-learn
kanayannet
October 22, 2017
Tweet
Share
More Decks by kanayannet
See All by kanayannet
Mcp Training
kanayannet
0
110
MCP で「こいつ動くぞ」
kanayannet
0
120
無関心の谷
kanayannet
0
950
生成AIの使いどころ
kanayannet
0
220
github copilot と 心理的安全性
kanayannet
0
250
FW と ライブラリ の考え方
kanayannet
0
260
TDDと今まで
kanayannet
0
620
個人開発 稼げなくてもいいアプリ
kanayannet
0
560
システムの堅牢性
kanayannet
0
320
Other Decks in Programming
See All in Programming
MUSUBIXとは
nahisaho
0
140
24時間止められないシステムを守る-医療ITにおけるランサムウェア対策の実際
koukimiura
1
110
CSC307 Lecture 01
javiergs
PRO
0
690
要求定義・仕様記述・設計・検証の手引き - 理論から学ぶ明確で統一された成果物定義
orgachem
PRO
1
190
The Past, Present, and Future of Enterprise Java
ivargrimstad
0
610
今こそ知るべき耐量子計算機暗号(PQC)入門 / PQC: What You Need to Know Now
mackey0225
3
380
CSC307 Lecture 09
javiergs
PRO
1
840
2026年 エンジニアリング自己学習法
yumechi
0
140
なるべく楽してバックエンドに型をつけたい!(楽とは言ってない)
hibiki_cube
0
140
AI Agent の開発と運用を支える Durable Execution #AgentsInProd
izumin5210
7
2.3k
AIによる開発の民主化を支える コンテキスト管理のこれまでとこれから
mulyu
3
430
CSC307 Lecture 02
javiergs
PRO
1
780
Featured
See All Featured
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
Marketing to machines
jonoalderson
1
4.6k
Practical Orchestrator
shlominoach
191
11k
The Anti-SEO Checklist Checklist. Pubcon Cyber Week
ryanjones
0
69
Art, The Web, and Tiny UX
lynnandtonic
304
21k
Google's AI Overviews - The New Search
badams
0
910
Agile that works and the tools we love
rasmusluckow
331
21k
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
63
Making the Leap to Tech Lead
cromwellryan
135
9.7k
Cheating the UX When There Is Nothing More to Optimize - PixelPioneers
stephaniewalter
287
14k
How to Get Subject Matter Experts Bought In and Actively Contributing to SEO & PR Initiatives.
livdayseo
0
67
Amusing Abliteration
ianozsvald
0
100
Transcript
機械学習で奇妙な冒険 @kanayannet Gunma.web #29
自己紹介 名前 : 金澤 宏昭 Twitter : @kanayannet Facebook :
HiroakiKanazawa
機械学習と私 2011 年9 月 spam_ lter-druby---classi er- https://github.com/kanayannet/spam_ lter- druby---classi
er-
おそらく まだ「機械学習」という言葉が流行ってなかった時代。
こっちの言葉の方が流行ってたかな? ベイズの定理 ベイジアンフィルター レコメンドエンジン
全部話すと大変 1 日じゃ終わらない。
今日話すこと なぜ話すのか? 機械学習の種類 奇妙な冒険 まずは動かしてみる 実験 まとめ
なぜ話すのか? 機械学習 という言葉が流行してから数年がたった。 web-db press でも扱われたし(8 月) そろそろ話してもい いかな?
機械学習の種類 アルゴリズムの分類 教師あり学習 教師なし学習 強化学習...etc
今日取り扱うもの 教師あり学習
理由 数年前作ったものを現在でも動くのか? 試したかった。 おそらく、動かない( 予想) 現代風に作り直すことである程度勉強になる
理由 教師なし学習.. 難しい!!>< 正直に言う、解らない!! 初心者でも解りそうな本あったら教えて!!
奇妙な冒険 JOJO の奇妙な冒険
なぜ? 名台詞がたくさんある!
何を学習させるの? 各キャラクターと名台詞
最終的に何をさせるの? 名台詞をIT 勉強会風に修正し どのキャラクターが言いそうな言葉か? 判定してもらう。
PG の構成 daemon.rb server 入力されたデータから学習し保存 入力されたデータから判定結果を返す mecab 形態要素解析 classi er
ベイズの定理 を利用 Classi er::Bayes json/pure
json/pure 学習用データをjson 形式で保存する drb/drb 通信した別プロセスとobject 空間を共有
PG の構成 test_inp.rb client 入力された学習データをサーバに渡す 判定用文章をサーバに渡し、判定結果を出力 drb/drb 通信した別プロセスとobject 空間を共有
まずは動かしてみる その前に ざっくりと コードを見てもらいます。 細かいところは省く
学習させるデータ構造 { キャラキター名}{ セリフ} = true
今からIT 勉強会風に修正します デモ中....
実験 学習データを少なくすると、どうなるか? 擬音は判定できるの?
まとめ 学習データは少ないと精度が悪い 単純なパターンマッチよりも精度が悪い 特殊な擬音 例 辞書に追加するなり、チューニング必須
参考文献 https://docs.ruby-lang.org/ja/latest/library/drb.html http://d.hatena.ne.jp/zariganitosh/20070712/1184230093 https://qiita.com/mhiro216/items/391ae79848129ac1cb2d
余談 classi er classi er-reborn が出ている こっちの方がいいかも? mecab natto が出ている
こっちの方がいいかも?
ガチな計算式 ベイズの定理 解りませんので、質問困る汗
ご清聴 ありがとうございました!