Lock in $30 Savings on PRO—Offer Ends Soon! ⏳
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習の勉強で出会った印象的なワード
Search
holywater044
October 29, 2020
Technology
1
36
機械学習の勉強で出会った印象的なワード
機械学習名古屋20200629登壇資料
https://machine-learning.connpass.com/event/178377/
holywater044
October 29, 2020
Tweet
Share
More Decks by holywater044
See All by holywater044
第4回Snowflake中部 User Group 〜DWの設計や運用、みんなどうしてるの? Snowflakeで迷うことディスカッション会~
holywater044
0
140
第3回 Snowflake 中部ユーザ会 - dbt x Snowflake ハンズオン - 状態イラスト抜粋版
holywater044
0
80
Tableau & Snowflake ハンズオン ~ データコラボレーションをぷち体験しよう ~
holywater044
1
300
Prepの集計機能についておさらいしてみる
holywater044
1
120
SageMakerDataWranglerでノンコードデータ前処理を試してみた
holywater044
0
48
時系列予測サービス Amazon Forecast の初学レポート
holywater044
0
36
Other Decks in Technology
See All in Technology
Playwrightのソースコードに見る、自動テストを自動で書く技術
yusukeiwaki
13
5.2k
MapKitとオープンデータで実現する地図情報の拡張と可視化
zozotech
PRO
1
130
AWSセキュリティアップデートとAWSを育てる話
cmusudakeisuke
0
220
日本Rubyの会の構造と実行とあと何か / hokurikurk01
takahashim
4
1k
AI 駆動開発勉強会 フロントエンド支部 #1 w/あずもば
1ftseabass
PRO
0
320
エンジニアリングマネージャー はじめての目標設定と評価
halkt
0
270
LT登壇を続けたらポッドキャストに呼ばれた話
yamatai1212
0
130
生成AI時代におけるグローバル戦略思考
taka_aki
0
120
手動から自動へ、そしてその先へ
moritamasami
0
300
Reinforcement Fine-tuning 基礎〜実践まで
ch6noota
0
170
Edge AI Performance on Zephyr Pico vs. Pico 2
iotengineer22
0
130
GitHub Copilotを使いこなす 実例に学ぶAIコーディング活用術
74th
3
2.5k
Featured
See All Featured
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.1k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
The Cost Of JavaScript in 2023
addyosmani
55
9.3k
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.2k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Raft: Consensus for Rubyists
vanstee
141
7.2k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
359
30k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
16k
The Language of Interfaces
destraynor
162
25k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
253
22k
Site-Speed That Sticks
csswizardry
13
990
Transcript
機械学習の勉強で出会った 印象的なワード 機械学習名古屋 第24回勉強会 2020-06-29 AKIHIRO HORIKAWA 1
自己紹介 名前: AKIHIRO HORIKAWA 所属: 総合エネルギー企業の技術研究所 仕事: データ分析(主にアセスメントとマネージメント) 資格: JDLA
G検定(2018#2)、他 コミュニティ: 機械学習名古屋、 中部Tableauユーザ会、 JAWS-UG名古屋、 他 趣味: 子供、データサイエンス勉強、ゲーム 課題: SNS 2
はじめに 3 ⚫ 機械学習を勉強しはじめて、かれこれ2年半くらいにな ります ⚫ その中で出会った印象的な言葉(用語? 格言? スラング?)を振り返ってみました ⚫
技術的な話は他の方達がやってくれると思うのでので、 息抜きでお付き合いください
4 『 前処理が8割 』
『前処理が8割』 ⚫ 意味 分析やモデリング以前に、生データをまともに分析できるようにす るまでが大変だよね。 ⚫ 出会い 忘れた(そこらじゅうで聞く) ⚫ 感想
• うなずくしかない • 後ろに「でもなかなかわかってもらえないんだよね」が付く • 「前処理」の指す範囲がはっきりしない データ確認、結合・整形、クリーニング、正規化・標準化、各種加工、 ホールドアウト、アノテーション、オーギュメンテーション、・・・。 EDA、特徴量設計は前処理に入るのかなぁ? 5
6 『 ラングリング 』
『ラングリング』 ⚫ 意味 「ラングリング」(wrangling)は、馬などを飼いならす、の意。 カウボーイ(wrangler)が暴れ馬を乗りこなすように、データを 自在に操るための収集・処理・分析・利用の総合テクニック。 参考:オライリー “Pythonではじめるデータラングリング” https://www.oreilly.co.jp/books/9784873117942/ ⚫
出会い 某AIベンチャーさんが使っていた ⚫ 感想 • 最初は、クレンジング・クリーニングのことかと思っていたたけど、 意味するところはもっと広く深い感じ • なんかカッコいい! 7
8 『 次元の呪い 』
『次元の呪い』 ⚫ 意味 • 特徴量の次元が大きいと、データ同士の超平面上の距離が同 じくらいに遠くなって、高精度のモデルが作れなくなること(?) • 次元が増えるほど、高い精度のモデルを作るために必要な訓練 データの量が爆発的に増えてしまうこと ⚫
出会い 渋谷駅前で働くデータサイエンティストさんのブログ https://tjo.hatenablog.com/entry/2013/10/22/193004 ⚫ 感想 • すみません、まだ腹に落とせてません・・・ • なんかカッコいい!(またか) 9
10 『 GIGO 』
『GIGO』 ⚫ 意味 “Garbage in, garbage out”の略。 意訳:ゴミデータからは、ゴミモデルしかできない。 ⚫ 出会い
MLSE経由でたどり着いた「仕事で始める機械学習」の有賀さん のスライド “機械学習プロジェクトアンチパータン?集” https://docs.google.com/presentation/d/192wLLgNzkbwuJ 8gLwu_SJMigwxg_EZrYeaK8vBoz3_I/edit#slide=id.p ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉1 • もらったデータから始めるしかないんで、いつも頭をよぎる 11
12 『 ノーフリーランチ 定理』
『ノーフリーランチ定理』 ⚫ 意味 「あらゆる問題を効率的に解決する解法」は理論上不可能で、 汎用的な最適解法というのは存在しない。 ⇒ DLがどんな問題にも正しいアプローチとは限らない ⚫ 出会い AINOWの記事
“ディープラーニングはすでに限界に達している のではないか?【後編】” https://ainow.ai/2019/02/19/162019/ ⚫ 感想 • 「タダ飯みたいなうまい話は無い」という例えが面白い • 元ネタがハインラインの『月は無慈悲な夜の女王』というのもイ カす(格言自体はもっと古くからあるらしい) 13
14 『 CACE 』
『CACE』 ⚫ 意味 “ChangeAnything ChangeEverything”の略。 何かが変わると全てが変わる、の意。 ⚫ 出会い 前出の有賀さんのスライド。 参考:Qiita“機械学習システムにおける「技術的負債」とその回避策”
https://qiita.com/fujit33/items/f58055667493ae79e2dd ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉その2 • いろいろ解釈できるけど、「学習データが少し変わっただけで~」、 「母集団の傾向が変わってしまい~」と理解 15
16 『 KISS 』
『KISS』 ⚫ 意味 愚直なまでにシンプルにせよ! 「Keep it simple stupid(単純かつ愚直であれ)」 「Keep it
simple, stupid(単純にしろ、この間抜け!)」 「Keep it short and simple(簡潔かつ単純であれ)」 ⚫ 出会い AINOWの記事 “データサイエンスはつまらない” https://ainow.ai/2019/10/14/179437/ ⚫ 感想 • いろいろ解釈できるけど、「複雑なアルゴリズム使えばいいわけ でない」、「特徴量加工もやりすぎはいけない」と理解 • 「設計思想のシンプルさ」みたいなのはすごく大事で、MLに限 らず真実だと思う 17
18 『 Human In The Loop 』
『Human In The Loop』 ⚫ 意味 MLなどによって自動化・自律化したシステムにおいて、一部の判 断や制御を人間が担うこと。 参考: https://japan.zdnet.com/article/35119800/
⚫ 出会い 1年くらい前、来栖川の偉い人にお聞きしたのが初耳。 ⚫ 感想 • 「人が入ることで、MLの不完全さ・不安定さを補う」、「データ蓄 積&アノテーションの壁を乗り越える道筋」と理解 • CDLE第2回勉強会で、ABEJA岡田社長も言及してた • 言葉としては、この後ちょっと流行して、わりとすぐ廃れちゃうん じゃないかという気がする 19
おわりに ⚫ このスライド書くために、evernoteに書き留めたものを 読み返していて、「ML勉強し始めて、わからないなりに いろいろ読み漁っていた頃」を思い出した ⚫ 最近そういうの薄くなってる気がするので、初心に帰って AINOWとかLeage.aiとかまた巡回しようと思った 20
21 ご清聴ありがとうございました。