Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
Search
houmei
April 24, 2018
Technology
0
180
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
houmei
April 24, 2018
Tweet
Share
More Decks by houmei
See All by houmei
ぼくのかんがえたさいきょうCPU 2018 スカラ演算
houmei
0
150
ぼくのかんがえたさいきょうCPU 2018 DATA
houmei
0
160
2018-BKSC-ALU
houmei
0
290
2017 CPU Architeciture
houmei
0
320
Other Decks in Technology
See All in Technology
20260311 ビジネスSWG活動報告(デジタルアイデンティティ人材育成推進WG Ph2 活動報告会)
oidfj
0
350
S3はフラットである –AWS公式SDKにも存在した、 署名付きURLにおけるパストラバーサル脆弱性– / JAWS DAYS 2026
flatt_security
0
1.8k
2026-03-11 JAWS-UG 茨城 #12 改めてALBを便利に使う
masasuzu
2
400
Lambda Web AdapterでLambdaをWEBフレームワーク利用する
sahou909
0
170
ソフトバンク流!プラットフォームエンジニアリング実現へのアプローチ
sbtechnight
1
190
生成AIで速度と品質を両立する、QAエンジニア・開発者連携のAI協調型テストプロセス
shota_kusaba
0
180
複数クラスタ運用と検索の高度化:ビズリーチにおけるElastic活用事例 / ElasticON Tokyo2026
visional_engineering_and_design
0
170
【Oracle Cloud ウェビナー】【入門編】はじめてのOracle AI Data Platform - AIのためのデータ準備&自社用AIエージェントをワンストップで実現
oracle4engineer
PRO
1
150
AI時代のSaaSとETL
shoe116
1
180
visionOS 開発向けの MCP / Skills をつくり続けることで XR の探究と学習を最大化
karad
1
590
楽しく学ぼう!ネットワーク入門
shotashiratori
1
460
形式手法特論:SMT ソルバで解く認可ポリシの静的解析 #kernelvm / Kernel VM Study Tsukuba No3
ytaka23
1
510
Featured
See All Featured
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.1k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
180
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
74
Let's Do A Bunch of Simple Stuff to Make Websites Faster
chriscoyier
508
140k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.8k
Navigating Weather and Climate Data
rabernat
0
140
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
199
73k
HDC tutorial
michielstock
1
560
First, design no harm
axbom
PRO
2
1.1k
Imperfection Machines: The Place of Print at Facebook
scottboms
269
14k
What's in a price? How to price your products and services
michaelherold
247
13k
Discover your Explorer Soul
emna__ayadi
2
1.1k
Transcript
΅͘ͷ͔Μ͕͑ͨ ͍͖͞ΐ͏CPU 2018.4.24 @houmei ϕΫτϧԋࢉ 184݄24Ր༵
༰ • ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPUͷղઆ • Ϩʔϯؒͷԋࢉʹ͍ͭͯʢϕΫτϧʣ twitter : @houmei blog :
ԼੈքౝͷܭࢉػΑ· 184݄24Ր༵
ϕΫτϧͱεΧϥ ɾσʔλશମΛ2ⁿόΠτ୯ҐͰׂͨ͠ ۠ըΛϨʔϯͱݺͿ ɾϨʔϯͯ͢ಉ͡ܕɺಉ͡αΠζ ɾϨʔϯ͕ͻͱ͚ͭͩͷͷΛεΧϥɺ ෳ͋ΔͷΛϕΫτϧͱݺͿ FP32 FP32 FP32 FP32
lane 0 lane 1 lane 2 lane 3 0 31 63 95 127 184݄24Ր༵
ݪଇ (1)ԋࢉ݁ՌRdͷσʔλαΠζɺϨʔϯɺܕ Ұ൪ͷιʔε(Ra)ʹ߹ΘͤΔ (2)ೋ൪ͷιʔε(Rb)ͷϨʔϯ͕RaͷϨʔϯ ΑΓগͳ͍߹܁Γฦ͠ద༻ (3)ೋ൪ͷιʔε(Rb)ͷϨʔϯ͕RaͷϨʔϯ ΑΓଟ͍߹ԼҐͷϨʔϯΛద༻ (4)Ϩʔϯؒͷԋࢉʹ͍ͭͯεΧϥԋࢉͷϧʔ ϧΛద༻ 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̍ʣ ɾRaͷϨʔϯ͕RbͷϨʔϯͱಉ͡߹ →ରԠ͢ΔϨʔϯͲ͏͠Ͱԋࢉ Lane3 D d D+d Lane2 C c
C+c Lane1 B ʴ b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̎ʣ ɾRaͷϨʔϯ͕RbΑΓগͳ͍߹ →ରԠ͢ΔRbͷԼҐϨʔϯͲ͏͠Ͱԋࢉ Lane3 d Lane2 c Lane1 B ʴ
b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̏ʣ ɾRaͷϨʔϯ͕RbΑΓଟ͍߹ →RbͷϨʔϯΛ܁Γฦ͠ద༻͠ԋࢉ Lane3 D D+b Lane2 C C+a Lane1
B ʴ b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×εΧϥ ɾRaͷϨʔϯ͕RbΑΓଟ͍߹ͱಉ͡ →RbΛ܁Γฦ͠ద༻͠ԋࢉ Lane3 D D+a Lane2 C C+a Lane1
B B+a Lane0 A ʴ a = A+a Ra Rb Rd 184݄24Ր༵
εΧϥ×ϕΫτϧ ɾRaͷϨʔϯ͕RbΑΓগͳ͍߹ͱಉ͡ →Rbͷ࠷ԼҐϨʔϯͰԋࢉ Lane3 d Lane2 c Lane1 b Lane0
A ʴ a ʹ A+a Ra Rb Rd 184݄24Ր༵
ଈͷѻ͍ • ԋࢉͷୈೋΦϖϥϯυଈͷࢦఆ͕Մೳ • ଈͷεΧϥσʔλͱͯ͠ѻΘΕΔ • ଈͷαΠζRaͷϨʔϯͷαΠζʹ߹Θͤූ ߸֦ு͞ΕΔ(.uम০ࢠͰθϩ֦ு) 184݄24Ր༵
ɹ ͭͮ͘ ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPU 184݄24Ր༵