Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
Search
houmei
April 24, 2018
Technology
180
0
Share
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
houmei
April 24, 2018
More Decks by houmei
See All by houmei
ぼくのかんがえたさいきょうCPU 2018 スカラ演算
houmei
0
150
ぼくのかんがえたさいきょうCPU 2018 DATA
houmei
0
160
2018-BKSC-ALU
houmei
0
290
2017 CPU Architeciture
houmei
0
320
Other Decks in Technology
See All in Technology
あるアーキテクチャ決定と その結果/architecture-decision-and-its-result
hanhan1978
0
270
OPENLOGI Company Profile
hr01
0
83k
スケーリングを封じられたEC2を救いたい
senseofunity129
0
140
バックオフィスPJのPjMをコーポレートITが担うとうまくいく3つの理由
yueda256
1
270
ZOZOTOWNリプレイスでのSkills導入までの流れとこれから
zozotech
PRO
2
2.4k
プロダクトを育てるように生成AIによる開発プロセスを育てよう
kakehashi
PRO
1
600
AIを活用したアクセシビリティ改善フロー
degudegu2510
1
140
Datadog で実現するセキュリティ対策 ~オブザーバビリティとセキュリティを 一緒にやると何がいいのか~
a2ush
0
190
Databricks Appsで実現する社内向けAIアプリ開発の効率化
r_miura
0
320
マルチモーダル非構造データとの闘い
shibuiwilliam
1
180
15年メンテしてきたdotfilesから開発トレンドを振り返る 2011 - 2026
giginet
PRO
2
280
OpenClawでPM業務を自動化
knishioka
2
390
Featured
See All Featured
Neural Spatial Audio Processing for Sound Field Analysis and Control
skoyamalab
0
240
The Mindset for Success: Future Career Progression
greggifford
PRO
0
300
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Money Talks: Using Revenue to Get Sh*t Done
nikkihalliwell
0
200
30 Presentation Tips
portentint
PRO
1
270
The Director’s Chair: Orchestrating AI for Truly Effective Learning
tmiket
1
140
Speed Design
sergeychernyshev
33
1.6k
AI Search: Implications for SEO and How to Move Forward - #ShenzhenSEOConference
aleyda
1
1.2k
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.3k
Measuring & Analyzing Core Web Vitals
bluesmoon
9
800
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
37
6.3k
Transcript
΅͘ͷ͔Μ͕͑ͨ ͍͖͞ΐ͏CPU 2018.4.24 @houmei ϕΫτϧԋࢉ 184݄24Ր༵
༰ • ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPUͷղઆ • Ϩʔϯؒͷԋࢉʹ͍ͭͯʢϕΫτϧʣ twitter : @houmei blog :
ԼੈքౝͷܭࢉػΑ· 184݄24Ր༵
ϕΫτϧͱεΧϥ ɾσʔλશମΛ2ⁿόΠτ୯ҐͰׂͨ͠ ۠ըΛϨʔϯͱݺͿ ɾϨʔϯͯ͢ಉ͡ܕɺಉ͡αΠζ ɾϨʔϯ͕ͻͱ͚ͭͩͷͷΛεΧϥɺ ෳ͋ΔͷΛϕΫτϧͱݺͿ FP32 FP32 FP32 FP32
lane 0 lane 1 lane 2 lane 3 0 31 63 95 127 184݄24Ր༵
ݪଇ (1)ԋࢉ݁ՌRdͷσʔλαΠζɺϨʔϯɺܕ Ұ൪ͷιʔε(Ra)ʹ߹ΘͤΔ (2)ೋ൪ͷιʔε(Rb)ͷϨʔϯ͕RaͷϨʔϯ ΑΓগͳ͍߹܁Γฦ͠ద༻ (3)ೋ൪ͷιʔε(Rb)ͷϨʔϯ͕RaͷϨʔϯ ΑΓଟ͍߹ԼҐͷϨʔϯΛద༻ (4)Ϩʔϯؒͷԋࢉʹ͍ͭͯεΧϥԋࢉͷϧʔ ϧΛద༻ 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̍ʣ ɾRaͷϨʔϯ͕RbͷϨʔϯͱಉ͡߹ →ରԠ͢ΔϨʔϯͲ͏͠Ͱԋࢉ Lane3 D d D+d Lane2 C c
C+c Lane1 B ʴ b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̎ʣ ɾRaͷϨʔϯ͕RbΑΓগͳ͍߹ →ରԠ͢ΔRbͷԼҐϨʔϯͲ͏͠Ͱԋࢉ Lane3 d Lane2 c Lane1 B ʴ
b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×ϕΫτϧʢ̏ʣ ɾRaͷϨʔϯ͕RbΑΓଟ͍߹ →RbͷϨʔϯΛ܁Γฦ͠ద༻͠ԋࢉ Lane3 D D+b Lane2 C C+a Lane1
B ʴ b = B+b Lane0 A a A+a Ra Rb Rd 184݄24Ր༵
ϕΫτϧ×εΧϥ ɾRaͷϨʔϯ͕RbΑΓଟ͍߹ͱಉ͡ →RbΛ܁Γฦ͠ద༻͠ԋࢉ Lane3 D D+a Lane2 C C+a Lane1
B B+a Lane0 A ʴ a = A+a Ra Rb Rd 184݄24Ր༵
εΧϥ×ϕΫτϧ ɾRaͷϨʔϯ͕RbΑΓগͳ͍߹ͱಉ͡ →Rbͷ࠷ԼҐϨʔϯͰԋࢉ Lane3 d Lane2 c Lane1 b Lane0
A ʴ a ʹ A+a Ra Rb Rd 184݄24Ր༵
ଈͷѻ͍ • ԋࢉͷୈೋΦϖϥϯυଈͷࢦఆ͕Մೳ • ଈͷεΧϥσʔλͱͯ͠ѻΘΕΔ • ଈͷαΠζRaͷϨʔϯͷαΠζʹ߹Θͤූ ߸֦ு͞ΕΔ(.uम০ࢠͰθϩ֦ு) 184݄24Ր༵
ɹ ͭͮ͘ ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPU 184݄24Ր༵