Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AVXって何だ?
Search
kkojima
September 15, 2020
Technology
1
720
AVXって何だ?
GPUなしでもここまでできるAI構築シリーズ2020.9.17
https://ibm-developer.connpass.com/event/187302/
kkojima
September 15, 2020
Tweet
Share
More Decks by kkojima
See All by kkojima
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 4」カスタムAIモデルの作成からモデルのデプロイまで
kkojima
0
210
最終回、オープンソースの話します
kkojima
1
210
AIデータはどうためる、テープアーカイブの復権
kkojima
0
150
AIに必要なデータをどう送るか、ネットワークを考える
kkojima
0
300
x86 CPUで動くAIアプリ作成で知っていると便利な基礎知識
kkojima
0
700
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 3」事前準備
kkojima
0
260
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 2」インテルがチューンしたPythonとTensorFlow
kkojima
0
1.4k
Dojo ++ 「GPUなしでもここまでできるAI構築シリーズ Part 2」環境構築手順
kkojima
0
360
Other Decks in Technology
See All in Technology
AI時代のデータセンターネットワーク
lycorptech_jp
PRO
1
280
KubeCon NA 2024 Recap: How to Move from Ingress to Gateway API with Minimal Hassle
ysakotch
0
200
ブラックフライデーで購入したPixel9で、Gemini Nanoを動かしてみた
marchin1989
1
530
10個のフィルタをAXI4-Streamでつなげてみた
marsee101
0
170
祝!Iceberg祭開幕!re:Invent 2024データレイク関連アップデート10分総ざらい
kniino
2
260
ずっと昔に Star をつけたはずの思い出せない GitHub リポジトリを見つけたい!
rokuosan
0
150
LINEスキマニにおけるフロントエンド開発
lycorptech_jp
PRO
0
330
Wantedly での Datadog 活用事例
bgpat
1
440
OpenAIの蒸留機能(Model Distillation)を使用して運用中のLLMのコストを削減する取り組み
pharma_x_tech
4
550
開発生産性向上! 育成を「改善」と捉えるエンジニア育成戦略
shoota
2
330
LINEヤフーのフロントエンド組織・体制の紹介【24年12月】
lycorp_recruit_jp
0
530
Jetpack Composeで始めるServer Cache State
ogaclejapan
2
170
Featured
See All Featured
Fireside Chat
paigeccino
34
3.1k
The Power of CSS Pseudo Elements
geoffreycrofte
73
5.4k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
132
33k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
Fight the Zombie Pattern Library - RWD Summit 2016
marcelosomers
232
17k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
44
6.9k
What's in a price? How to price your products and services
michaelherold
243
12k
How To Stay Up To Date on Web Technology
chriscoyier
789
250k
How GitHub (no longer) Works
holman
311
140k
Site-Speed That Sticks
csswizardry
2
190
No one is an island. Learnings from fostering a developers community.
thoeni
19
3k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
2
170
Transcript
GPUなしでもここまでできるAI構築シリーズ 2020.9.17 「AVXってなんだ?」
「GPUなしでもここまでできるAI構築」 今回のシリーズでの範囲は: 出荷数が圧倒的に多いインテル x86 CPU を対象とします (Macユーザ、⼤歓迎) IBM Cloud でも利⽤できる
AVX-512 搭載機種がベスト でも AVX2 でもそれなりに実感できるはず
全4回あります (初回は座学のみ 第2,3,4回はハンズオンあり) 1回 9⽉17⽇ 14:00 座学 2回 10⽉29⽇ 14:00
座学, ハンズオン 3回 11⽉12⽇ 14:00 座学, ハンズオン 4回 12⽉10⽇ 14:00 座学, ハンズオン 「GPUなしでもここまでできるAI構築」
わたしたちの環境
計算⽅法によって機械には向き不向きがある JAMSTEC 地球シュミレータ ベクトル演算専⽤機 (おそらく現⾏では唯⼀) シミュレーションモデルが使うメモリが⼤きなベクトル演算に特化
AVX ってなんだ? ベクトル演算ってなんだ? CPUはハードウェアだけど、必ずソフトウェアが命令を出している AIやシミュレーションで重要な命令にSIMDがある SIMDを使った演算をベクトル演算という SIMD: Single Instruction Multiple
Data AVX: Advanced Vector Extensions
AVX ってなんだ? AIと関係あるの? シミュレーションではモデル(本物の特徴を掴んだ枠)をつくる ⽔や空気、物体などは3次元以上の要素でモデルを計算する必要がある GPU: 重要な要素だけ選択的に計算して表⽰することが得意(ゲーム映像など) CPU: 緻密に再現することが得意 (AVXはこの密度を⾼める)
Deep Learningではシミュレーションと同じベクトル演算が使われる
AVX ってなんだ? どれくらい強⼒なの? コンピュータの能⼒の尺度に FLOPS (⼀秒に何回浮動⼩数点 演算ができるか)があります AVXなし 1 FLOPS/クロック
AVXあり 8 FLOPS/クロック AVX2あり 16 FLOPS/クロック もし性能が⼗分にひきだせるソフトを利⽤するならばAVXなし に⽐較するとAVX2は16倍の性能がクロックあたり出せるかも
AVX ってなんだ? インテルだけ? AVXはAMDのCPUにも⼊っている AVX2, AVX-512と進化している (こちらはインテルが先⾏)
AVX ってなんだ? CPUが対応していればOK? AVXはハードウェアの機能 (CPUに埋め込まれている) でもほんとうに⼤事なのは開発環境(ソフトウェア) このシリーズではここを深掘りします
AI 専⽤機だとどうなっているの? おすすめ資料: CQ出版社 ⽉刊インターフェース 10⽉号 ほとんどの製品、コンセプトが網羅されている (DLU はあったけど SX-Aurora
がなかったのは残念) 過渡期の今、われわれがどこにいるかわかる
本⽇の⽬⽟ この事実にあなたはおどろく。。 「インテル製 TensorFlow があるなんて」
次回以降の環境 Mac sysctl machdep.cpu.brand_string Windows 10 (PowerShell) @((Get-WmiObject Win32_Processor).Name)[0] Linux
lscpu | grep "Model name” (仮想環境だとうまく表⽰されないので lscpu 出⼒の Flags:を確認) 1. Google、Qwant など検索エンジンで出⼒を調べる (Intel製だったら) Intel Ark というCPUスペック表がみつかるはず 2. AVX2, AVX-512 が記載されていれば当たりです もし表⽰がなくてもこのシリーズの⼿順は素振り練習としてできます お⼿元の環境を次回までにご確認ください
例: Macが該当しているか調べる kojima@mac ~ % sysctl machdep.cpu.brand_string machdep.cpu.brand_string: Intel(R) Core(TM)
i5-4278U CPU @ 2.60GHz i5-4278U を Web 検索 さらに ark.intel.comの該当ページで “AVX” を検索 すると “Instruction Set Extensions Intel® SSE4.1, Intel® SSE4.2, Intel® AVX2” AVX2 当たり!
まずは楽しんでください !