Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習概要
Search
oshokawa
June 10, 2015
0
2.4k
機械学習概要
Geek Salon for Startups vol. 2 2015.06.10
@MSさん
oshokawa
June 10, 2015
Tweet
Share
More Decks by oshokawa
See All by oshokawa
密度比推定による異常検知
oshokawa
6
11k
DQN
oshokawa
2
1k
機械学習入門 + Amazon MLちょっと触ってみた
oshokawa
0
1.7k
センシングデータの異常検知
oshokawa
1
2k
Featured
See All Featured
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
109
49k
Bash Introduction
62gerente
608
210k
Mobile First: as difficult as doing things right
swwweet
222
8.9k
A better future with KSS
kneath
238
17k
Typedesign – Prime Four
hannesfritz
40
2.4k
Fireside Chat
paigeccino
34
3k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
880
Designing Experiences People Love
moore
138
23k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
250
21k
Into the Great Unknown - MozCon
thekraken
32
1.5k
Build The Right Thing And Hit Your Dates
maggiecrowley
33
2.4k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
364
24k
Transcript
機械学習概要 この資料には、弊社のノウハウ、営業機密等が含まれておりますので、お取り扱いには十分ご留意 願います。この資料およびその内容を、弊社に無断で使用、複写、破壊、改�ざんすること、ならび に第三者へ開示すること、漏洩すること、あるいは使用させることは、固くお断り申しあげます。 滝 勇太 22001155..0066..1100 GGeeeekk SSaalloonn ffoorr SSttaarrttuuppss
vvooll.. 22 本資料:ssppeeaakkeerrddeecckk oosshhookkaawwaa 1
自己紹介 名前:滝((石川)) 勇太 専門:機械学習 職種:でーたさいえんてぃすと((笑)) 趣味:ぬこ ウニ様 ♀ ((アメリカンカール)) トロ様 ♀ ((マンチカン))
2
歴史的なお話 3
11995500 22001100 11997700 11998800 11999900 22000000 11996600 推論・探索 11sstt ニューラルネット((線�形))
エキスパートシステム 22nndd ニューラルネット((非線�形)) 遺伝的アルゴリズム 強化学習 人工知能 11sstt AAII 22nndd AAII 33rrdd AAII 冬 冬 ダートマス会議 ※ aauutthhoorriizzeeされた経緯・分類ではありません 人工知能・機械学習・データマイニング 4
11995500 22001100 11997700 11998800 11999900 22000000 11996600 推論・探索 11sstt ニューラルネット((線�形))
エキスパートシステム 22nndd ニューラルネット((非線�形)) 遺伝的アルゴリズム 強化学習 機械学習 データマイニング 人工知能 11sstt AAII 22nndd AAII 33rrdd AAII 冬 冬 ダートマス会議 • 人工知能 • 知能っぽいもの • 機械学習の応用 • 機械学習 • 数学っぽい学習((最適化)) • データマイニング • 学習っていうか発見 ※ aauutthhoorriizzeeされた経緯・分類ではありません 人工知能・機械学習・データマイニング 5
11995500 22001100 11997700 11998800 11999900 22000000 11996600 推論・探索 11sstt ニューラルネット((線�形))
エキスパートシステム 22nndd ニューラルネット((非線�形)) 遺伝的アルゴリズム 強化学習 機械学習 データマイニング DDeeeepp LLeeaarrnniinngg 人工知能 33rrdd ニューラルネット((DDeeeepp)) 11sstt AAII 22nndd AAII 33rrdd AAII 冬 冬 ダートマス会議 ※ aauutthhoorriizzeeされた経緯・分類ではありません 全脳アーキテクチャ 汎用人工知能 人工知能・機械学習・データマイニング • 人工知能 • 知能っぽいもの • 機械学習の応用 • 機械学習 • 数学っぽい学習((最適化)) • データマイニング • 学習っていうか発見 6
aa sseett ooff mmeetthhooddss tthhaatt ccaann aauuttoommaattiiccaallllyy ddeetteecctt ppaatttteerrnnss iinn
ddaattaa,, aanndd tthheenn uussee tthhee uunnccoovveerreedd ppaatttteerrnnss ttoo pprreeddiicctt ffuuttuurree ddaattaa,, oorr ttoo ppeerrffoorrmm ootthheerr kkiinnddss ooff ddeecciissiioonn mmaakkiinngg uunnddeerr uunncceerrttaaiinnttyy 機械学習とは、 • データから自動的にパターンを発見し、 • 将来のデータの予測や意思決定に利用する、 ための手法群である KK.. PP.. MMuurrpphhyy.. MMaacchhiinnee LLeeaarrnniinngg AA pprroobbaabbiilliissttiicc PPeerrssppeeccttiivvee.. TThhee MMIITT PPrreessss.. 22001122.. 機械学習 ʙ 個人的に好きな表現 ʙ 7
機械学習なお話 8
機械学習でやらなきゃいけないこと 9 モデル 元データ 学習データ 検証データ 最終モデル 予測対象データ 予測結果 予測対象元データ
前処理 学習 評価 前処理 予測 前処理
機械学習でやらなきゃいけないこと 10 モデル 元データ 学習データ 検証データ 最終モデル 予測対象データ 予測結果 予測対象元データ
前処理 学習 評価 前処理 予測 前処理
機械学習でやらなきゃいけないこと 11 モデル 元データ 学習データ 検証データ 最終モデル 予測対象データ 予測結果 予測対象元データ
前処理 学習 評価 前処理 予測 前処理
機械学習でやらなきゃいけないこと 12 モデル 元データ 学習データ 検証データ 最終モデル 予測対象データ 予測結果 予測対象元データ
前処理 学習 前処理 評価 前処理 予測 ここが モヤモヤ する 前処理
機械学習の中の人 13
「学習」って? 14 独立変数 ii..ee.. 年齢,, 性別,, 年収,, eettcc.. 従属変数 ii..ee..
買う // 買わない,, eettcc.. 独立変数 従属変数 == ff(( )) 学習データからモデル((のパラメータ))を求める モデル 学習データ
「学習」って? 15 体重 == 傾き × 身長 ++ 切片 学習データに合うように
傾きと切片を求めること 学習 モデル 従属変数 体重[[kkgg]] 説明変数 身長[[ccmm]] 6655 117700 5500 116600 7700 117755 学習データ =
「学習」って? 16 学習データに合うように 傾きと切片を求めること 実際に上の例を「学習」すると 学習 体重 == 11..335577 ×
身長 − 116666..778866 = 体重 == 傾き × 身長 ++ 切片 モデル 従属変数 体重[[kkgg]] 説明変数 身長[[ccmm]] 6655 117700 5500 116600 7700 117755 学習データ
ちなみに・・・ 17 目的によって 「従属変数」がある場合とない場合があります ある場合 ((教師あり学習)) ない場合 ((教師なし学習)) 回帰 とか
分類 クラスタリングとか次元削減 • 顧客タイプ • 設備稼働状態 のグルーピング • ドキュメント • 人の繋がりの可視化 eettcc.. • 株価の予測((できるの?)) • ユーザ登録数変化 • 契約 する // しない • 正常 // 異常
ちなみに・・・ 18 目的によって 「従属変数」がある場合とない場合があります ある場合 ((教師あり学習)) ない場合 ((教師なし学習)) 回帰 とか
分類 クラスタリングとか次元削減 • 顧客タイプ • 設備稼働状態 のグルーピング • ドキュメント • 人の繋がりの可視化 eettcc.. • 株価の予測((できるの?)) • ユーザ登録数変化 • 契約 する // しない • 正常 // 異常 今日のハンズオン はこれ((の発展版))
今日のハンズオンの 準備体操 〜 分類?クラスタリング? 〜 19
分類((教師あり)) 20 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 独立変数 従属変数 猫好き 犬好き
分類((教師あり)) 21 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 独立変数 従属変数 猫好き 犬好き データに猫好き・犬好きのラベル((従属変数))が付いている場合には それらを「分ける」境界を学習する((教師あり学習))
クラスタリング((教師なし)) 22 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 独立変数 ラベルが付いてない場合には 従属変数 猫好き 犬好き ない
クラスタリング((教師なし)) 23 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 独立変数 ラベルが付いてない場合には 独立変数が 何らかの意味において 似ている人を まとめる
クラスタリング((教師なし)) 24 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 独立変数 ラベルが付いてない場合には 独立変数が 何らかの意味において 似ている人を まとめる
クラスタリング((教師なし)) 25 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 独立変数 ラベルが付いてない場合には 独立変数が 何らかの意味において 似ている人を まとめる
クラスタリング((教師なし)) 26 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 独立変数 ラベルが付いてない場合には 独立変数が 何らかの意味において 似ている人を まとめる
クラスタリング((教師なし)) 27 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 独立変数が 何らかの意味において 似ている人を まとめる どんなグループが出てくるかはやってからのお楽しみ♥ 独立変数 ラベルが付いてない場合には
クラスタリング((教師なし)) 28 ・ペットが猫 ・猫tweet多い ・猫顔 ・語尾が「にゃん」
・アイコンが猫 ・retweetが猫ネタ ・ペットが犬 ・語尾が「わん」 ・犬顔 ・アイコンが犬 ・retweetが犬ネタ ・犬tweet多い ・犬顔 ・語尾が「にゃん」 詳しくは WWEEBB この後の発表 & ハンズオン で!! 独立変数 ラベルが付いてない場合には 独立変数が 何らかの意味において 似ている人を まとめる どんなグループが出てくるかはやってからのお楽しみ♥
なにはともあれ 29
機械学習でやらなきゃいけないこと 30 モデル 元データ 学習データ 検証データ 最終モデル 予測対象データ 予測結果 予測対象元データ
前処理 学習 評価 前処理 予測 前処理
めんどくせぇ 31
なんか ツールかサービス がほしいよね! 32
最近は便利になりました MMLLaaaaSSっぽいものを含むサービス その他機械学習的なフレームワーク 33
最近は便利になりました MMLLaaaaSSっぽいものを含むサービス その他機械学習的なフレームワーク 34 本日はこれ! さっきの一連の 流れが実現できる
それでは引き続きハンズオンを お楽しみください〜 TTwwiitttteerr @@oosshhookkaawwaa FFaacceebbooookk 滝 勇太 35