Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習イントロダクション/machine-learning-lecture-introduc...
Search
monochromegane
July 13, 2020
Technology
0
8.6k
機械学習イントロダクション/machine-learning-lecture-introduction
GMOペパボ新卒研修2020 機械学習入門 補足資料#01
monochromegane
July 13, 2020
Tweet
Share
More Decks by monochromegane
See All by monochromegane
ベクトル検索システムの気持ち
monochromegane
33
11k
Go言語での実装を通して学ぶ、高速なベクトル検索を支えるクラスタリング技術/fukuokago-kmeans
monochromegane
1
170
Go言語でターミナルフレンドリーなAIコマンド、afaを作った/fukuokago20_afa
monochromegane
2
240
多様かつ継続的に変化する環境に適応する情報システム/thesis-defense-presentation
monochromegane
1
890
Online Nonstationary and Nonlinear Bandits with Recursive Weighted Gaussian Process
monochromegane
0
530
AIを前提とした体験の実現に向けて/toward_ai_based_experiences
monochromegane
2
950
Go言語でMac GPUプログラミング
monochromegane
1
600
Contextual and Nonstationary Multi-armed Bandits Using the Linear Gaussian State Space Model for the Meta-Recommender System
monochromegane
1
1k
迅速な学習機構を用いて逐次適応性を損なうことなく非線形性を扱う文脈付き多腕バンディット手法/extreme_neural_linear_bandits
monochromegane
0
2.2k
Other Decks in Technology
See All in Technology
AIエージェントデザインパターンの選び方
almondo_event
0
150
mnt_data_とは?ChatGPTコード実行環境を深堀りしてみた
icck
0
210
セキュリティSaaS企業が実践するCursor運用ルールと知見 / How a Security SaaS Company Runs Cursor: Rules & Insights
tetsuzawa
0
400
大規模PaaSにおける監視基盤の構築と効率化の道のり
lycorptech_jp
PRO
0
180
RDRA3.0を知ろう
kanzaki
2
430
What's Next in OpenShift Q2 CY2025
redhatlivestreaming
1
800
金融システムをモダナイズするためのAmazon Elastic Kubernetes Service(EKS)ノウハウ大全
daitak
0
120
プロジェクトマネジメント実践論|現役エンジニアが語る!~チームでモノづくりをする時のコツとは?~
mixi_engineers
PRO
3
180
toittaにOpenTelemetryを導入した話 / Mackerel APM リリースパーティ
cohalz
1
490
CloudBruteによる外部からのS3バケットの探索・公開の発見について / 20250605 Kumiko Hennmi
shift_evolve
3
160
ソフトウェアは捨てやすく作ろう/Let's make software easy to discard
sanogemaru
10
5.8k
ITエンジニアを取り巻く環境とキャリアパス / A career path for Japanese IT engineers
takatama
4
1.5k
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
126
17k
GitHub's CSS Performance
jonrohan
1031
460k
The Art of Programming - Codeland 2020
erikaheidi
54
13k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
233
17k
Java REST API Framework Comparison - PWX 2021
mraible
31
8.6k
Building an army of robots
kneath
306
45k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
331
21k
How To Stay Up To Date on Web Technology
chriscoyier
790
250k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
12k
The Invisible Side of Design
smashingmag
299
50k
Building a Modern Day E-commerce SEO Strategy
aleyda
40
7.3k
Reflections from 52 weeks, 52 projects
jeffersonlam
349
20k
Transcript
1 ペパボ研究所 三宅悠介 新卒研修 機械学習入門 補足資料#01 (2020/07/12 Update) 機械学習 イントロダクション
2 2 機械学習とは何か そして、何ではないか
3 プログラムが、データから知識を学習すること、また それを用いてタスクを実行する手法のこと 3 機械学習とは 機械学習とは何か
4 入力から出力を推測したい やりたいこと 4
5 入力から出力を推測したい やりたいこと 5 入力から出力を予測 する関数を考える
6 入力から出力を推測したい やりたいこと 6 切片w0と傾きw1を持 つ一次関数で表す
7 入力から出力を予測したい やりたくないこと 7 ② w0とw1を発見させるプロ グラムを書く ① w0とw1を自分で決める
8 入力から出力を予測したい やりたくないこと 8 ② w0とw1を発見させるプロ グラムを書く ① w0とw1を自分で決める ❌
9 9 データから学習する、とは 機械学習とは何か プログラムによって 入力に対して 望ましい出力を返すよう 数式のパラメータを調整すること
10 ① データの生成規則をモデルとして記述する 10 データから学習する、ためには 機械学習とは何か 入出力(変数) 数式の構造 数式のパラメータ
11 ① データの生成規則をモデルとして記述する ② モデルの良し悪しを定式化する 11 データから学習する、ためには 機械学習とは何か
12 ① データの生成規則をモデルとして記述する ② モデルの良し悪しを定式化する ③ 現在のパラメータの良し悪しを②式で評価 12 データから学習する、ためには 機械学習とは何か
13 ① データの生成規則をモデルとして記述する ② モデルの良し悪しを定式化する ③ 現在のパラメータの良し悪しを②式で評価 ④ ③の評価に基づきパラメータを調整 13
データから学習する、ためには 機械学習とは何か
14 ① データの生成規則をモデルとして記述する ② モデルの良し悪しを定式化する ③ 現在のパラメータの良し悪しを②式で評価 ④ ③の評価に基づきパラメータを調整 14
データから学習する、ためには 機械学習とは何か
15 ① データの生成規則をモデルとして記述する ② モデルの良し悪しを定式化する ③ 現在のパラメータの良し悪しを②式で評価 ④ ③の評価に基づきパラメータを調整 ⑤
モデルを用いてタスクを実行する 15 データから学習する、ためには 機械学習とは何か
16 16 機械学習のタスク 何のために学習するのか
17 プログラムが、データから知識を学習すること、また それを用いてタスクを実行する手法のこと 17 機械学習とは(再掲) 機械学習とは何か
18 機械学習では、モデルが前提と するデータの生成規則におけ る、未知のデータに対してどれ だけそのタスクをよくこなせるか が求められる。 18 モデルとタスクと汎化 機械学習とは何か
19 19 回帰 (Regression) 代表的な機械学習のタスク 入力から出力を予測する問題設定。 出力は連続値として得られる。 入出力の関係性は、訓練データ(ラベル付きの例) から学習する(教師あり学習)
例)気温から売り上げを予測、土地の特徴から家屋の価格を予測
20 20 分類 (Classification) 代表的な機械学習のタスク 入力から出力を予測する問題設定。 出力は離散値(有限集合の要素)で得られる。 入出力の関係性は、訓練データ(ラベル付きの例) から学習する(教師あり学習)
例)スパムメール分類、手書き文字認識
21 21 クラスタリング (Clustering) 代表的な機械学習のタスク 入力をいくつかのクラスタに分割する問題設定。 クラスタは、入力データ自身の性質から学習する (教師なし学習) 例)商品特徴による動的なカテゴリ生成
22 機械学習のタスクと手法 22 機械学習のタスク 機械学習の手法(モデル、アルゴリズム) 教師あり 分類 ロジスティック回帰 SVM 決定木
ニューラルネットワークなど 回帰 線形回帰 リッジ回帰 決定木 ニューラルネットワークなど 教師なし クラスタリング k-meansなど 次元削減 PCAなど など -
23 23 なぜ機械学習を学ぶのか
24 Webサービスの利用者の行動(や意図)はログをはじめ とするデータとして観測できる。 データの背景を記述し学習する機械学習の手法を習 得することで、個々の利用者の振る舞いに適応する データ駆動なシステムを実現し、エンジニアリングに よってファンを増やすことにつながる。 24 「ファンを増やす」 なぜ機械学習を学ぶのか