Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ぼくのかんがえたさいきょうCPU 2018 スカラ演算
Search
houmei
April 23, 2018
Technology
0
120
ぼくのかんがえたさいきょうCPU 2018 スカラ演算
houmei
April 23, 2018
Tweet
Share
More Decks by houmei
See All by houmei
ぼくのかんがえたさいきょうCPU 2018 ベクトル演算
houmei
0
160
ぼくのかんがえたさいきょうCPU 2018 DATA
houmei
0
130
2018-BKSC-ALU
houmei
0
270
2017 CPU Architeciture
houmei
0
300
Other Decks in Technology
See All in Technology
令和最新版 Ruby プロファイラ "Pf2" のご紹介
osyoyu
0
150
LLM開発・活用の舞台裏@2024.04.25
yushin_n
3
1.3k
社内アプリで Cloudflare D1を プロダクト運用してみた体験談(Tokyo)
haochenx
0
130
非同期推論システムによるコスト削減と信頼性向上
koki_nishihara
1
380
Oracle Base Database Service 技術詳細
oracle4engineer
PRO
5
37k
競技としてのKaggle、役に立つKaggle
yu4u
6
2.4k
AWSに詳しくない人でも始められるコスト最適化ガイド
yuhta28
2
410
Grafana x PagerDuty Better Together
jacopen
1
300
Babylon.jsと色々なものを組み合わせる:ブラウザのAPIやガジェットや2D描画ライブラリなど / Babylon.js 勉強会 vol.3
you
PRO
0
180
開発パフォーマンスを最大化するための開発体制
ham0215
7
1.2k
Cypress or Playwright?
rainerhahnekamp
0
180
生産性向上チームの紹介
cybozuinsideout
PRO
1
950
Featured
See All Featured
RailsConf 2023
tenderlove
9
560
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
41
4.4k
Agile that works and the tools we love
rasmusluckow
325
20k
Imperfection Machines: The Place of Print at Facebook
scottboms
261
12k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
352
28k
Fashionably flexible responsive web design (full day workshop)
malarkey
398
65k
Building Better People: How to give real-time feedback that sticks.
wjessup
356
18k
In The Pink: A Labor of Love
frogandcode
138
21k
Large-scale JavaScript Application Architecture
addyosmani
504
110k
Building Flexible Design Systems
yeseniaperezcruz
320
37k
Raft: Consensus for Rubyists
vanstee
133
6.3k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
155
14k
Transcript
΅͘ͷ͔Μ͕͑ͨ ͍͖͞ΐ͏CPU 2018.4.23 @houmei εΧϥԋࢉ 184݄23݄༵
༰ • ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPUͷղઆ • ҟͳΔܕͷԋࢉʹ͍ͭͯʢεΧϥʣ twitter : @houmei blog :
ԼੈքౝͷܭࢉػΑ· 184݄23݄༵
ѻ͏ܕͱσʔλαΠζ ɾܕʢූ߸͋Γ/ූ߸ͳ͠ʣ ɾුಈখܕ ɾेਐුಈখܕ ͜ΕΒͷҟͳΔܕͱҟͳΔσʔλαΠζ Ͳ͏͠ͷԋࢉʹ͍ͭͯ 184݄23݄༵
ݪଇ (1)ԋࢉ݁ՌRdͷσʔλαΠζҰ൪ͷ ιʔε(Ra)ʹ߹ΘͤΔ (2)ԋࢉ݁ՌRdͷܕҰ൪ͷιʔε(Ra) ʹ߹ΘͤΔ ※(2)ྫ֎ : POPC/CLZ/CTZϏοτΛ ͑ΔͷͰRdܕ 184݄23݄༵
ιʔεͷܗࣜʁ Ұ൪ͷιʔεΛRaɺ ೋ൪Ҏ߱ͷιʔεΛRbͱ͢Δɿ ɾࢉज़ԋࢉ໋ྩɹRbRaʹ߹ΘͤΔ ɾཧԋࢉ໋ྩɹRbRaʹ߹ΘͤΔ ɾϏοτԋࢉ໋ྩɹRbͦͷ·· ɾγϑτ໋ྩɹRbͦͷ·· ※Rbʹࢦఆͨ͠ϨδελʹܕαΠζ ө͞Ε·ͤΜɻԋࢉ࣌ͷΈมɻ 184݄23݄༵
ͱʢ̍ʣ ɾRaͱRbͷαΠζ͕ಉ͡߹→ͳ͠ ɾRaΑΓRbͷαΠζ͕େ͖͍߹ ɹ→Rbͷ্ҐΛΧοτ͠ԋࢉ Ra Rb Rb’ Rd 184݄23݄༵
ͱʢ̎ʣ ɾRaΑΓRbͷαΠζ͕খ͍͞߹ ɹ→RbͷMSBΛූ߸֦ு͠ԋࢉ 1010111111110100 1111111111111111 1010111111110100 Ra Rb Rb’ Rd
184݄23݄༵
ͱʢ̏ʣ ɾRaΑΓRbͷαΠζ͕খ͍͞߹ ɹ→ԋࢉ໋ྩͷࢦࣔʹΑΓ( .u म০) ɹɹRbͷMSBΛθϩ֦ு͠ԋࢉ 1010111111110100 0000000000000000 1010111111110100 Ra
Rb Rb’ Rd 184݄23݄༵
ͷѻ͍ ɾͷූ߸ͳ͠/ූ߸͋Γ(̎ͷิ)ͷ ۠ผΛܕͰѻ͏͔ → ѻΘͳ͍ ɹैདྷͷϓϩηαͱͷޓੑҡ࣋ͷͨΊ ɾσϑΥϧτͰූ߸͖ͱͯ͠ѻ͏ ɾූ߸ͳ໋͠ྩͷम০ࢠ .u Ͱ໌ʹѻ͏
184݄23݄༵
ුಈখܕʢ̍ʣ ɾਫ਼͕ҟͳΔ߹ ɹ→Rbͷਫ਼ΛRaʹ߹ΘͤΔ ɾม࣌ͷΦʔόʔϑϩʔRfʹηοτ FP64 FP32 FP64 FP64 Ra Rb
Rb’ Rd 184݄23݄༵
ුಈখܕʢ̎ʣ ɾܕ͕ҟͳΔ߹ʢेਐුಈখࠞࡏʣ ɹ→Rbͷܕͱਫ਼ΛRaʹ߹ΘͤΔ ɾม࣌ͷΦʔόʔϑϩʔRfʹηοτ DP64 FP32 DP64 DP64 Ra Rb
Rb’ Rd 184݄23݄༵
ුಈখͱ ɾRa͕ුಈখܕɺRb͕ͷͱ͖ ɹ→RbΛRaͱಉ͡ුಈখܕͱαΠζ ʹม ɾม࣌ͷΦʔόʔϑϩʔRfʹηοτ FP32 Int 64bit FP32 FP32
Ra Rb Rb’ Rd 184݄23݄༵
ͱුಈখ ɾRa͕ɺRb͕ුಈখܕͷͱ͖ ɹ→RbΛRaͱಉ͡αΠζͷʹม ɾม࣌ͷΦʔόʔϑϩʔRfʹηοτ Int 64bit FP32 Int 64bit Int
64bit Ra Rb Rb’ Rd 184݄23݄༵
ؙΊ • ුಈখܕΛѻ͏ࢉज़ԋࢉ໋ྩʹम০ࢠͱ͠ ͯՃ • σϑΥϧτͷؙΊࢦࣔͱ̑छྨͷؙΊࢦఆ .rneɺ.rnaɺ.rzɺ.rpiɺ.pmi 184݄23݄༵
·ͱΊ • ԋࢉ݁ՌͷαΠζͱܕRaʹ߹ΘͤΔ • ԋࢉͷલʹRbͷαΠζͱܕΛRaʹ߹ΘͤΔ • ͕ූ߸͖/ූ߸ͳ͠ͷѻ͍ʢූ߸֦ுʣ ԋࢉ໋ྩʹͤΔ • ුಈখͷԋࢉมͷؙΊࢉज़ԋࢉ໋ྩ
Ͱѻ͏ 184݄23݄༵
ɹ ͭͮ͘ ΅͘ͷ͔Μ͕͍͖͑ͨ͞ΐ͏CPU 184݄23݄༵