Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
Search
houmei
April 24, 2018
Technology
0
160
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
houmei
April 24, 2018
Tweet
Share
More Decks by houmei
See All by houmei
ぼくのかんがえたさいきょうCPU 2018 スカラ演算
houmei
0
120
ぼくのかんがえたさいきょうCPU 2018 DATA
houmei
0
130
2018-BKSC-ALU
houmei
0
270
2017 CPU Architeciture
houmei
0
300
Other Decks in Technology
See All in Technology
少数チームで挑む: SwiftUI, TCA, KMPを用いた 新規動画配信アプリ 「ABEMA Live」の開発について
tomu28
0
610
GraphQL 成熟度モデルの紹介と、プロダクトに当てはめた事例 / GraphQL maturity model
mh4gf
7
1.2k
FrontDoorとWebAppsを組み合わせた際のリダイレクト処理の注意点
kenichirokimura
1
430
Azure Container Apps + Bicep 〜 こんな感じで運用しています
kaz29
2
380
ワールドカフェI /チューターを改良する / World Café I and Improving the Tutors
ks91
PRO
0
110
**強い**エンジニアのなり方 - フィードバックサイクルを勝ち取る / grow one day each day
soudai
64
19k
現代CSSフレームワークの内部実装とその仕組み
poteboy
8
3.4k
ユーザーストーリーのレビューを自動化したみたの
bun913
1
380
EMとして2023年度に頑張ったこと / What we did well in FY2023 as a EM
pauli
1
140
レガシーをぶっ壊せ。AEONで始めるDevRelの話 / Qiita Night 2024-2-22
aeonpeople
3
1.2k
生産性向上チームの紹介
cybozuinsideout
PRO
1
840
MySQL の SQL クエリチューニングの要所を掴む勉強会
andpad
2
5.1k
Featured
See All Featured
It's Worth the Effort
3n
180
27k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
19
1.9k
Visualization
eitanlees
135
14k
Done Done
chrislema
178
15k
Happy Clients
brianwarren
91
6.4k
Making Projects Easy
brettharned
108
5.5k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
77
42k
4 Signs Your Business is Dying
shpigford
175
21k
The Mythical Team-Month
searls
215
42k
What’s in a name? Adding method to the madness
productmarketing
PRO
15
2.6k
Code Reviewing Like a Champion
maltzj
513
39k
Principles of Awesome APIs and How to Build Them.
keavy
120
16k
Transcript
΅͘ͷ͔Μ͕͑ͨ ͍͖͞ΐ͏CPU 2018.4.24 @houmei ϕΫτϧԋࢉ 184݄24Ր༵
༰ • ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPUͷղઆ • Ϩʔϯؒͷԋࢉʹ͍ͭͯʢϕΫτϧʣ twitter : @houmei blog :
ԼੈքౝͷܭࢉػΑ· 184݄24Ր༵
ϕΫτϧͱεΧϥ ɾσʔλશମΛ2ⁿόΠτ୯ҐͰׂͨ͠ ۠ըΛϨʔϯͱݺͿ ɾϨʔϯͯ͢ಉ͡ܕɺಉ͡αΠζ ɾϨʔϯ͕ͻͱ͚ͭͩͷͷΛεΧϥɺ ෳ͋ΔͷΛϕΫτϧͱݺͿ FP32 FP32 FP32 FP32
lane 0 lane 1 lane 2 lane 3 0 31 63 95 127 184݄24Ր༵
ݪଇ (1)ԋࢉ݁ՌRdͷσʔλαΠζɺϨʔϯɺܕ Ұ൪ͷιʔε(Ra)ʹ߹ΘͤΔ (2)ೋ൪ͷιʔε(Rb)ͷϨʔϯ͕RaͷϨʔϯ ΑΓগͳ͍߹܁Γฦ͠ద༻ (3)ೋ൪ͷιʔε(Rb)ͷϨʔϯ͕RaͷϨʔϯ ΑΓଟ͍߹ԼҐͷϨʔϯΛద༻ (4)Ϩʔϯؒͷԋࢉʹ͍ͭͯεΧϥԋࢉͷϧʔ ϧΛద༻ 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̍ʣ ɾRaͷϨʔϯ͕RbͷϨʔϯͱಉ͡߹ →ରԠ͢ΔϨʔϯͲ͏͠Ͱԋࢉ Lane3 D d D+d Lane2 C c
C+c Lane1 B ʴ b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̎ʣ ɾRaͷϨʔϯ͕RbΑΓগͳ͍߹ →ରԠ͢ΔRbͷԼҐϨʔϯͲ͏͠Ͱԋࢉ Lane3 d Lane2 c Lane1 B ʴ
b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̏ʣ ɾRaͷϨʔϯ͕RbΑΓଟ͍߹ →RbͷϨʔϯΛ܁Γฦ͠ద༻͠ԋࢉ Lane3 D D+b Lane2 C C+a Lane1
B ʴ b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×εΧϥ ɾRaͷϨʔϯ͕RbΑΓଟ͍߹ͱಉ͡ →RbΛ܁Γฦ͠ద༻͠ԋࢉ Lane3 D D+a Lane2 C C+a Lane1
B B+a Lane0 A ʴ a = A+a Ra Rb Rd 184݄24Ր༵
εΧϥ×ϕΫτϧ ɾRaͷϨʔϯ͕RbΑΓগͳ͍߹ͱಉ͡ →Rbͷ࠷ԼҐϨʔϯͰԋࢉ Lane3 d Lane2 c Lane1 b Lane0
A ʴ a ʹ A+a Ra Rb Rd 184݄24Ր༵
ଈͷѻ͍ • ԋࢉͷୈೋΦϖϥϯυଈͷࢦఆ͕Մೳ • ଈͷεΧϥσʔλͱͯ͠ѻΘΕΔ • ଈͷαΠζRaͷϨʔϯͷαΠζʹ߹Θͤූ ߸֦ு͞ΕΔ(.uम০ࢠͰθϩ֦ு) 184݄24Ր༵
ɹ ͭͮ͘ ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPU 184݄24Ր༵