Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
機械学習の勉強で出会った印象的なワード
Search
holywater044
October 29, 2020
Technology
1
22
機械学習の勉強で出会った印象的なワード
機械学習名古屋20200629登壇資料
https://machine-learning.connpass.com/event/178377/
holywater044
October 29, 2020
Tweet
Share
More Decks by holywater044
See All by holywater044
第3回 Snowflake 中部ユーザ会 - dbt x Snowflake ハンズオン - 状態イラスト抜粋版
holywater044
0
30
Tableau & Snowflake ハンズオン ~ データコラボレーションをぷち体験しよう ~
holywater044
1
190
Prepの集計機能についておさらいしてみる
holywater044
1
74
SageMakerDataWranglerでノンコードデータ前処理を試してみた
holywater044
0
33
時系列予測サービス Amazon Forecast の初学レポート
holywater044
0
23
Other Decks in Technology
See All in Technology
表現を育てる
kiyou77
1
210
スタートアップ1人目QAエンジニアが QAチームを立ち上げ、“個”からチーム、 そして“組織”に成長するまで / How to set up QA team at reiwatravel
mii3king
2
1.5k
AndroidデバイスにFTPサーバを建立する
e10dokup
0
250
Swiftの “private” を テストする / Testing Swift "private"
yutailang0119
0
130
ビジネスモデリング道場 目的と背景
masuda220
PRO
9
520
個人開発から公式機能へ: PlaywrightとRailsをつなげた3年の軌跡
yusukeiwaki
11
3k
Larkご案内資料
customercloud
PRO
0
650
現場の種を事業の芽にする - エンジニア主導のイノベーションを事業戦略に装着する方法 -
kzkmaeda
2
2.1k
ホワイトボードチャレンジ 説明&実行資料
ichimichi
0
130
2/18/25: Java meets AI: Build LLM-Powered Apps with LangChain4j
edeandrea
PRO
0
110
第13回 Data-Centric AI勉強会, 画像認識におけるData-centric AI
ksaito_osx
0
370
現場で役立つAPIデザイン
nagix
33
12k
Featured
See All Featured
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.2k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
29
2.4k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
160
15k
Producing Creativity
orderedlist
PRO
344
39k
What's in a price? How to price your products and services
michaelherold
244
12k
4 Signs Your Business is Dying
shpigford
182
22k
Practical Orchestrator
shlominoach
186
10k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
4
330
The Language of Interfaces
destraynor
156
24k
Designing on Purpose - Digital PM Summit 2013
jponch
117
7.1k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Transcript
機械学習の勉強で出会った 印象的なワード 機械学習名古屋 第24回勉強会 2020-06-29 AKIHIRO HORIKAWA 1
自己紹介 名前: AKIHIRO HORIKAWA 所属: 総合エネルギー企業の技術研究所 仕事: データ分析(主にアセスメントとマネージメント) 資格: JDLA
G検定(2018#2)、他 コミュニティ: 機械学習名古屋、 中部Tableauユーザ会、 JAWS-UG名古屋、 他 趣味: 子供、データサイエンス勉強、ゲーム 課題: SNS 2
はじめに 3 ⚫ 機械学習を勉強しはじめて、かれこれ2年半くらいにな ります ⚫ その中で出会った印象的な言葉(用語? 格言? スラング?)を振り返ってみました ⚫
技術的な話は他の方達がやってくれると思うのでので、 息抜きでお付き合いください
4 『 前処理が8割 』
『前処理が8割』 ⚫ 意味 分析やモデリング以前に、生データをまともに分析できるようにす るまでが大変だよね。 ⚫ 出会い 忘れた(そこらじゅうで聞く) ⚫ 感想
• うなずくしかない • 後ろに「でもなかなかわかってもらえないんだよね」が付く • 「前処理」の指す範囲がはっきりしない データ確認、結合・整形、クリーニング、正規化・標準化、各種加工、 ホールドアウト、アノテーション、オーギュメンテーション、・・・。 EDA、特徴量設計は前処理に入るのかなぁ? 5
6 『 ラングリング 』
『ラングリング』 ⚫ 意味 「ラングリング」(wrangling)は、馬などを飼いならす、の意。 カウボーイ(wrangler)が暴れ馬を乗りこなすように、データを 自在に操るための収集・処理・分析・利用の総合テクニック。 参考:オライリー “Pythonではじめるデータラングリング” https://www.oreilly.co.jp/books/9784873117942/ ⚫
出会い 某AIベンチャーさんが使っていた ⚫ 感想 • 最初は、クレンジング・クリーニングのことかと思っていたたけど、 意味するところはもっと広く深い感じ • なんかカッコいい! 7
8 『 次元の呪い 』
『次元の呪い』 ⚫ 意味 • 特徴量の次元が大きいと、データ同士の超平面上の距離が同 じくらいに遠くなって、高精度のモデルが作れなくなること(?) • 次元が増えるほど、高い精度のモデルを作るために必要な訓練 データの量が爆発的に増えてしまうこと ⚫
出会い 渋谷駅前で働くデータサイエンティストさんのブログ https://tjo.hatenablog.com/entry/2013/10/22/193004 ⚫ 感想 • すみません、まだ腹に落とせてません・・・ • なんかカッコいい!(またか) 9
10 『 GIGO 』
『GIGO』 ⚫ 意味 “Garbage in, garbage out”の略。 意訳:ゴミデータからは、ゴミモデルしかできない。 ⚫ 出会い
MLSE経由でたどり着いた「仕事で始める機械学習」の有賀さん のスライド “機械学習プロジェクトアンチパータン?集” https://docs.google.com/presentation/d/192wLLgNzkbwuJ 8gLwu_SJMigwxg_EZrYeaK8vBoz3_I/edit#slide=id.p ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉1 • もらったデータから始めるしかないんで、いつも頭をよぎる 11
12 『 ノーフリーランチ 定理』
『ノーフリーランチ定理』 ⚫ 意味 「あらゆる問題を効率的に解決する解法」は理論上不可能で、 汎用的な最適解法というのは存在しない。 ⇒ DLがどんな問題にも正しいアプローチとは限らない ⚫ 出会い AINOWの記事
“ディープラーニングはすでに限界に達している のではないか?【後編】” https://ainow.ai/2019/02/19/162019/ ⚫ 感想 • 「タダ飯みたいなうまい話は無い」という例えが面白い • 元ネタがハインラインの『月は無慈悲な夜の女王』というのもイ カす(格言自体はもっと古くからあるらしい) 13
14 『 CACE 』
『CACE』 ⚫ 意味 “ChangeAnything ChangeEverything”の略。 何かが変わると全てが変わる、の意。 ⚫ 出会い 前出の有賀さんのスライド。 参考:Qiita“機械学習システムにおける「技術的負債」とその回避策”
https://qiita.com/fujit33/items/f58055667493ae79e2dd ⚫ 感想 • “データでプログラミングする”というMLの特性を顕した言葉その2 • いろいろ解釈できるけど、「学習データが少し変わっただけで~」、 「母集団の傾向が変わってしまい~」と理解 15
16 『 KISS 』
『KISS』 ⚫ 意味 愚直なまでにシンプルにせよ! 「Keep it simple stupid(単純かつ愚直であれ)」 「Keep it
simple, stupid(単純にしろ、この間抜け!)」 「Keep it short and simple(簡潔かつ単純であれ)」 ⚫ 出会い AINOWの記事 “データサイエンスはつまらない” https://ainow.ai/2019/10/14/179437/ ⚫ 感想 • いろいろ解釈できるけど、「複雑なアルゴリズム使えばいいわけ でない」、「特徴量加工もやりすぎはいけない」と理解 • 「設計思想のシンプルさ」みたいなのはすごく大事で、MLに限 らず真実だと思う 17
18 『 Human In The Loop 』
『Human In The Loop』 ⚫ 意味 MLなどによって自動化・自律化したシステムにおいて、一部の判 断や制御を人間が担うこと。 参考: https://japan.zdnet.com/article/35119800/
⚫ 出会い 1年くらい前、来栖川の偉い人にお聞きしたのが初耳。 ⚫ 感想 • 「人が入ることで、MLの不完全さ・不安定さを補う」、「データ蓄 積&アノテーションの壁を乗り越える道筋」と理解 • CDLE第2回勉強会で、ABEJA岡田社長も言及してた • 言葉としては、この後ちょっと流行して、わりとすぐ廃れちゃうん じゃないかという気がする 19
おわりに ⚫ このスライド書くために、evernoteに書き留めたものを 読み返していて、「ML勉強し始めて、わからないなりに いろいろ読み漁っていた頃」を思い出した ⚫ 最近そういうの薄くなってる気がするので、初心に帰って AINOWとかLeage.aiとかまた巡回しようと思った 20
21 ご清聴ありがとうございました。