Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
Search
houmei
April 24, 2018
Technology
0
170
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
houmei
April 24, 2018
Tweet
Share
More Decks by houmei
See All by houmei
ぼくのかんがえたさいきょうCPU 2018 スカラ演算
houmei
0
150
ぼくのかんがえたさいきょうCPU 2018 DATA
houmei
0
150
2018-BKSC-ALU
houmei
0
290
2017 CPU Architeciture
houmei
0
310
Other Decks in Technology
See All in Technology
SQLだけでマイグレーションしたい!
makki_d
0
550
Reinforcement Fine-tuning 基礎〜実践まで
ch6noota
0
190
シニアソフトウェアエンジニアになるためには
kworkdev
PRO
3
180
IAMユーザーゼロの運用は果たして可能なのか
yama3133
2
490
MariaDB Connector/C のcaching_sha2_passwordプラグインの仕様について
boro1234
0
410
子育てで想像してなかった「見えないダメージ」 / Unforeseen "hidden burdens" of raising children.
pauli
2
270
ウェルネス SaaS × AI、1,000万ユーザーを支える 業界特化 AI プロダクト開発への道のり
hacomono
PRO
0
140
生成AI活用の型ハンズオン〜顧客課題起点で設計する7つのステップ
yushin_n
0
240
業務のトイルをバスターせよ 〜AI時代の生存戦略〜
staka121
PRO
2
220
.NET 10の概要
tomokusaba
0
120
Lambdaの常識はどう変わる?!re:Invent 2025 before after
iwatatomoya
1
630
エンジニアリングをやめたくないので問い続ける
estie
2
1.2k
Featured
See All Featured
Principles of Awesome APIs and How to Build Them.
keavy
127
17k
Balancing Empowerment & Direction
lara
5
800
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
54k
Rails Girls Zürich Keynote
gr2m
95
14k
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Making the Leap to Tech Lead
cromwellryan
135
9.7k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
980
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
26
3.3k
Done Done
chrislema
186
16k
Embracing the Ebb and Flow
colly
88
4.9k
jQuery: Nuts, Bolts and Bling
dougneiner
65
8.3k
Transcript
΅͘ͷ͔Μ͕͑ͨ ͍͖͞ΐ͏CPU 2018.4.24 @houmei ϕΫτϧԋࢉ 184݄24Ր༵
༰ • ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPUͷղઆ • Ϩʔϯؒͷԋࢉʹ͍ͭͯʢϕΫτϧʣ twitter : @houmei blog :
ԼੈքౝͷܭࢉػΑ· 184݄24Ր༵
ϕΫτϧͱεΧϥ ɾσʔλશମΛ2ⁿόΠτ୯ҐͰׂͨ͠ ۠ըΛϨʔϯͱݺͿ ɾϨʔϯͯ͢ಉ͡ܕɺಉ͡αΠζ ɾϨʔϯ͕ͻͱ͚ͭͩͷͷΛεΧϥɺ ෳ͋ΔͷΛϕΫτϧͱݺͿ FP32 FP32 FP32 FP32
lane 0 lane 1 lane 2 lane 3 0 31 63 95 127 184݄24Ր༵
ݪଇ (1)ԋࢉ݁ՌRdͷσʔλαΠζɺϨʔϯɺܕ Ұ൪ͷιʔε(Ra)ʹ߹ΘͤΔ (2)ೋ൪ͷιʔε(Rb)ͷϨʔϯ͕RaͷϨʔϯ ΑΓগͳ͍߹܁Γฦ͠ద༻ (3)ೋ൪ͷιʔε(Rb)ͷϨʔϯ͕RaͷϨʔϯ ΑΓଟ͍߹ԼҐͷϨʔϯΛద༻ (4)Ϩʔϯؒͷԋࢉʹ͍ͭͯεΧϥԋࢉͷϧʔ ϧΛద༻ 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̍ʣ ɾRaͷϨʔϯ͕RbͷϨʔϯͱಉ͡߹ →ରԠ͢ΔϨʔϯͲ͏͠Ͱԋࢉ Lane3 D d D+d Lane2 C c
C+c Lane1 B ʴ b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̎ʣ ɾRaͷϨʔϯ͕RbΑΓগͳ͍߹ →ରԠ͢ΔRbͷԼҐϨʔϯͲ͏͠Ͱԋࢉ Lane3 d Lane2 c Lane1 B ʴ
b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̏ʣ ɾRaͷϨʔϯ͕RbΑΓଟ͍߹ →RbͷϨʔϯΛ܁Γฦ͠ద༻͠ԋࢉ Lane3 D D+b Lane2 C C+a Lane1
B ʴ b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×εΧϥ ɾRaͷϨʔϯ͕RbΑΓଟ͍߹ͱಉ͡ →RbΛ܁Γฦ͠ద༻͠ԋࢉ Lane3 D D+a Lane2 C C+a Lane1
B B+a Lane0 A ʴ a = A+a Ra Rb Rd 184݄24Ր༵
εΧϥ×ϕΫτϧ ɾRaͷϨʔϯ͕RbΑΓগͳ͍߹ͱಉ͡ →Rbͷ࠷ԼҐϨʔϯͰԋࢉ Lane3 d Lane2 c Lane1 b Lane0
A ʴ a ʹ A+a Ra Rb Rd 184݄24Ր༵
ଈͷѻ͍ • ԋࢉͷୈೋΦϖϥϯυଈͷࢦఆ͕Մೳ • ଈͷεΧϥσʔλͱͯ͠ѻΘΕΔ • ଈͷαΠζRaͷϨʔϯͷαΠζʹ߹Θͤූ ߸֦ு͞ΕΔ(.uम০ࢠͰθϩ֦ு) 184݄24Ր༵
ɹ ͭͮ͘ ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPU 184݄24Ր༵