Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習 勉強会 #1
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
xkumiyu
May 06, 2016
Science
0
810
機械学習 勉強会 #1
xkumiyu
May 06, 2016
Tweet
Share
Other Decks in Science
See All in Science
【RSJ2025】PAMIQ Core: リアルタイム継続学習のための⾮同期推論・学習フレームワーク
gesonanko
0
650
Rashomon at the Sound: Reconstructing all possible paleoearthquake histories in the Puget Lowland through topological search
cossatot
0
520
コンピュータビジョンによるロボットの視覚と判断:宇宙空間での適応と課題
hf149
1
530
2025-06-11-ai_belgium
sofievl
1
230
Accelerating operator Sinkhorn iteration with overrelaxation
tasusu
0
200
baseballrによるMLBデータの抽出と階層ベイズモデルによる打率の推定 / TokyoR118
dropout009
2
810
やるべきときにMLをやる AIエージェント開発
fufufukakaka
2
1.1k
Amusing Abliteration
ianozsvald
0
110
凸最適化からDC最適化まで
santana_hammer
1
350
データベース04: SQL (1/3) 単純質問 & 集約演算
trycycle
PRO
0
1.1k
先端因果推論特別研究チームの研究構想と 人間とAIが協働する自律因果探索の展望
sshimizu2006
3
770
データベース06: SQL (3/3) 副問い合わせ
trycycle
PRO
1
720
Featured
See All Featured
Highjacked: Video Game Concept Design
rkendrick25
PRO
1
290
Marketing to machines
jonoalderson
1
4.7k
<Decoding/> the Language of Devs - We Love SEO 2024
nikkihalliwell
1
130
Learning to Love Humans: Emotional Interface Design
aarron
275
41k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
120
Color Theory Basics | Prateek | Gurzu
gurzu
0
200
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.3k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.1k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
240
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
350
GraphQLとの向き合い方2022年版
quramy
50
14k
Transcript
機械学習 勉強会 #1 2016.5.6 @xkumiyu
⾃⼰紹介 lTwitter ID: @xkumiyu l⼤学:ソーシャルメディアを使ったデー タマイニング的なことをやってました。 l仕事:サービス企画。最近、データ分析 はじめました。 2
今⽇、話すこと lkNN法(k最近傍法)の概要 lPython(scikit-learn)での実装例 最近、読みはじめました。 3
クラス分類(Classfication) l予め与えられたクラスに関する知識に基づいて、未知のパ ターンがどのクラスに属するかを決定すること 4
クラス分類の⽅法 l事後確率による⽅法 l確率分布を仮定して、事後確率が最⼤のクラスに分類 l例)ベイズの最⼤事後確率法(単純ベイズ分類器?) l距離による⽅法 l⼊⼒ベクトルとクラスの代表ベクトルとの距離が⼀番近いクラスに分類 l例)最近傍法 l関数値による⽅法 l関数f(x)の正負または最⼤値でクラスを決める l例)パーセプトロン、サポートベクターマシン
l決定⽊による⽅法 l識別規則の真偽に応じて、次の識別規則を順次適応し、クラスを決める l例)決定⽊ 5
最近傍法とは l⼊⼒データとすべての学習データの距離(⼀般にユークリッ ド距離)を計算して、最も近いデータのクラスに識別する⼿法 6
kNN法(k最近傍法) l⼊⼒データとの距離が近いk個のデータをとってきて、最も 多く所属するクラスに識別する⼿法 7 k=3 •:2つ •:1つ → • に識別
kNN法(k最近傍法) l⼊⼒データとの距離が近いk個のデータをとってきて、最も 多く所属するクラスに識別する⼿法 8 k=4 •:2つ •:2つ → リジェクト ※ランダムに識別する場合もある
kNN法(k最近傍法) l⼊⼒データとの距離が近いk個のデータをとってきて、最も 多く所属するクラスに識別する⼿法 9 k=8 •:3つ •:5つ → • に識別
Pythonで実装 l機械学習パッケージ「scikit-learn」を使う 10 クラス分類 • SVM、近傍法、ランダムフォ レスト クラスタリング • k-means、Mean-Shift
次元削減 • 主成分分析 検証 • 交差検証法
scikit-learnを使う 11 メソッド fit(X, y) 学習データをモデルに適⽤(学習)、 Xがデータで、yがラベル(クラス) predict(X) ⼊⼒データのクラスを予測 score(X,
y) テストデータXと正解クラスyを与え た時の正答率を算出 ※他のモデルでも使い⽅は同じ(らしい)
Cross-Validationもscikit-learnで 12
交差検証法(Cross-Validation) l全データをk個に分割して、1個をテストデータ、残りを学習 データとする。 lテストデータを変えて、k回繰り返す。 13 テスト データ 学習 データ 学習
データ 学習 データ 学習 データ テスト データ 学習 データ 学習 データ 学習 データ 学習 データ … k回繰り返す
Kを変化させた結果 lkを⼤きくすると、ノイズデータに対して強くなり、精度が上がる。 l⼤きくしすぎると、他のクラスのデータも多く含まれるようになるため、 精度が落ちる。 14