Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習の勉強で出会った印象的なワード
Search
holywater044
October 29, 2020
Technology
1
20
機械学習の勉強で出会った印象的なワード
機械学習名古屋20200629登壇資料
https://machine-learning.connpass.com/event/178377/
holywater044
October 29, 2020
Tweet
Share
More Decks by holywater044
See All by holywater044
Tableau & Snowflake ハンズオン ~ データコラボレーションをぷち体験しよう ~
holywater044
1
180
Prepの集計機能についておさらいしてみる
holywater044
1
69
SageMakerDataWranglerでノンコードデータ前処理を試してみた
holywater044
0
29
時系列予測サービス Amazon Forecast の初学レポート
holywater044
0
20
Other Decks in Technology
See All in Technology
Snowflake女子会#3 Snowpipeの良さを5分で語るよ
lana2548
0
230
Postman と API セキュリティ / Postman and API Security
yokawasa
0
200
1等無人航空機操縦士一発試験 合格までの道のり ドローンミートアップ@大阪 2024/12/18
excdinc
0
160
20241220_S3 tablesの使い方を検証してみた
handy
4
400
オプトインカメラ:UWB測位を応用したオプトイン型のカメラ計測
matthewlujp
0
170
Wantedly での Datadog 活用事例
bgpat
1
440
フロントエンド設計にモブ設計を導入してみた / 20241212_cloudsign_TechFrontMeetup
bengo4com
0
1.9k
Oracle Cloud Infrastructure:2024年12月度サービス・アップデート
oracle4engineer
PRO
0
180
祝!Iceberg祭開幕!re:Invent 2024データレイク関連アップデート10分総ざらい
kniino
3
260
GitHub Copilot のテクニック集/GitHub Copilot Techniques
rayuron
36
13k
サーバレスアプリ開発者向けアップデートをキャッチアップしてきた #AWSreInvent #regrowth_fuk
drumnistnakano
0
190
WACATE2024冬セッション資料(ユーザビリティ)
scarletplover
0
200
Featured
See All Featured
Designing Dashboards & Data Visualisations in Web Apps
destraynor
229
52k
Rails Girls Zürich Keynote
gr2m
94
13k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
44
9.3k
Docker and Python
trallard
42
3.1k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
169
50k
Become a Pro
speakerdeck
PRO
26
5k
Building an army of robots
kneath
302
44k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
5
450
GraphQLの誤解/rethinking-graphql
sonatard
67
10k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
226
22k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.3k
The Art of Programming - Codeland 2020
erikaheidi
53
13k
Transcript
機械学習の勉強で出会った 印象的なワード 機械学習名古屋 第24回勉強会 2020-06-29 AKIHIRO HORIKAWA 1
自己紹介 名前: AKIHIRO HORIKAWA 所属: 総合エネルギー企業の技術研究所 仕事: データ分析(主にアセスメントとマネージメント) 資格: JDLA
G検定(2018#2)、他 コミュニティ: 機械学習名古屋、 中部Tableauユーザ会、 JAWS-UG名古屋、 他 趣味: 子供、データサイエンス勉強、ゲーム 課題: SNS 2
はじめに 3 ⚫ 機械学習を勉強しはじめて、かれこれ2年半くらいにな ります ⚫ その中で出会った印象的な言葉(用語? 格言? スラング?)を振り返ってみました ⚫
技術的な話は他の方達がやってくれると思うのでので、 息抜きでお付き合いください
4 『 前処理が8割 』
『前処理が8割』 ⚫ 意味 分析やモデリング以前に、生データをまともに分析できるようにす るまでが大変だよね。 ⚫ 出会い 忘れた(そこらじゅうで聞く) ⚫ 感想
• うなずくしかない • 後ろに「でもなかなかわかってもらえないんだよね」が付く • 「前処理」の指す範囲がはっきりしない データ確認、結合・整形、クリーニング、正規化・標準化、各種加工、 ホールドアウト、アノテーション、オーギュメンテーション、・・・。 EDA、特徴量設計は前処理に入るのかなぁ? 5
6 『 ラングリング 』
『ラングリング』 ⚫ 意味 「ラングリング」(wrangling)は、馬などを飼いならす、の意。 カウボーイ(wrangler)が暴れ馬を乗りこなすように、データを 自在に操るための収集・処理・分析・利用の総合テクニック。 参考:オライリー “Pythonではじめるデータラングリング” https://www.oreilly.co.jp/books/9784873117942/ ⚫
出会い 某AIベンチャーさんが使っていた ⚫ 感想 • 最初は、クレンジング・クリーニングのことかと思っていたたけど、 意味するところはもっと広く深い感じ • なんかカッコいい! 7
8 『 次元の呪い 』
『次元の呪い』 ⚫ 意味 • 特徴量の次元が大きいと、データ同士の超平面上の距離が同 じくらいに遠くなって、高精度のモデルが作れなくなること(?) • 次元が増えるほど、高い精度のモデルを作るために必要な訓練 データの量が爆発的に増えてしまうこと ⚫
出会い 渋谷駅前で働くデータサイエンティストさんのブログ https://tjo.hatenablog.com/entry/2013/10/22/193004 ⚫ 感想 • すみません、まだ腹に落とせてません・・・ • なんかカッコいい!(またか) 9
10 『 GIGO 』
『GIGO』 ⚫ 意味 “Garbage in, garbage out”の略。 意訳:ゴミデータからは、ゴミモデルしかできない。 ⚫ 出会い
MLSE経由でたどり着いた「仕事で始める機械学習」の有賀さん のスライド “機械学習プロジェクトアンチパータン?集” https://docs.google.com/presentation/d/192wLLgNzkbwuJ 8gLwu_SJMigwxg_EZrYeaK8vBoz3_I/edit#slide=id.p ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉1 • もらったデータから始めるしかないんで、いつも頭をよぎる 11
12 『 ノーフリーランチ 定理』
『ノーフリーランチ定理』 ⚫ 意味 「あらゆる問題を効率的に解決する解法」は理論上不可能で、 汎用的な最適解法というのは存在しない。 ⇒ DLがどんな問題にも正しいアプローチとは限らない ⚫ 出会い AINOWの記事
“ディープラーニングはすでに限界に達している のではないか?【後編】” https://ainow.ai/2019/02/19/162019/ ⚫ 感想 • 「タダ飯みたいなうまい話は無い」という例えが面白い • 元ネタがハインラインの『月は無慈悲な夜の女王』というのもイ カす(格言自体はもっと古くからあるらしい) 13
14 『 CACE 』
『CACE』 ⚫ 意味 “ChangeAnything ChangeEverything”の略。 何かが変わると全てが変わる、の意。 ⚫ 出会い 前出の有賀さんのスライド。 参考:Qiita“機械学習システムにおける「技術的負債」とその回避策”
https://qiita.com/fujit33/items/f58055667493ae79e2dd ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉その2 • いろいろ解釈できるけど、「学習データが少し変わっただけで~」、 「母集団の傾向が変わってしまい~」と理解 15
16 『 KISS 』
『KISS』 ⚫ 意味 愚直なまでにシンプルにせよ! 「Keep it simple stupid(単純かつ愚直であれ)」 「Keep it
simple, stupid(単純にしろ、この間抜け!)」 「Keep it short and simple(簡潔かつ単純であれ)」 ⚫ 出会い AINOWの記事 “データサイエンスはつまらない” https://ainow.ai/2019/10/14/179437/ ⚫ 感想 • いろいろ解釈できるけど、「複雑なアルゴリズム使えばいいわけ でない」、「特徴量加工もやりすぎはいけない」と理解 • 「設計思想のシンプルさ」みたいなのはすごく大事で、MLに限 らず真実だと思う 17
18 『 Human In The Loop 』
『Human In The Loop』 ⚫ 意味 MLなどによって自動化・自律化したシステムにおいて、一部の判 断や制御を人間が担うこと。 参考: https://japan.zdnet.com/article/35119800/
⚫ 出会い 1年くらい前、来栖川の偉い人にお聞きしたのが初耳。 ⚫ 感想 • 「人が入ることで、MLの不完全さ・不安定さを補う」、「データ蓄 積&アノテーションの壁を乗り越える道筋」と理解 • CDLE第2回勉強会で、ABEJA岡田社長も言及してた • 言葉としては、この後ちょっと流行して、わりとすぐ廃れちゃうん じゃないかという気がする 19
おわりに ⚫ このスライド書くために、evernoteに書き留めたものを 読み返していて、「ML勉強し始めて、わからないなりに いろいろ読み漁っていた頃」を思い出した ⚫ 最近そういうの薄くなってる気がするので、初心に帰って AINOWとかLeage.aiとかまた巡回しようと思った 20
21 ご清聴ありがとうございました。