5mm
2.5mm
PLL+
BGR
22ch TIA
for TDC
22ch TIA
for ADC
22ch
TDC
11ch
ADC
11ch
ADC Digital
Circuits
自己紹介
◼ 慶應大 石黒研究室
◼ 東芝 研究開発センター 入社(2014)
◼研究の軸足:回路設計技術
Slide 5
Slide 5 text
ムーアの法則~集積回路の発展~
Figure in courtesy of K. Rupp, “42 years of Microprocessor Trend Data”,
https://www.karlrupp.net/2018/02/42-years-of-microprocessor-trend-data/
.
Slide 6
Slide 6 text
ムーアの法則~集積回路の発展~
Figure in courtesy of K. Rupp, “42 years of Microprocessor Trend Data”,
https://www.karlrupp.net/2018/02/42-years-of-microprocessor-trend-data/
.
世界初のCPU
Intel 4004 トランジスタ数:2250
Slide 7
Slide 7 text
ムーアの法則~集積回路の発展~
Figure in courtesy of K. Rupp, “42 years of Microprocessor Trend Data”,
https://www.karlrupp.net/2018/02/42-years-of-microprocessor-trend-data/
.
世界初のCPU
Intel 4004 トランジスタ数:2250
CMOSプロセス:10um
ムーアの法則:集積されるトランジスタ数は2年で倍に
→CPUのトランジスタ数は1000万倍向上
Apple M2 Pro
トランジスタ数:400億
CMOSプロセス:5nm
ムーアの法則と限界
Figure in courtesy of K. Rupp, “42 years of Microprocessor Trend Data”,
https://www.karlrupp.net/2018/02/42-years-of-microprocessor-trend-data/
.
ムーアの法則の鈍化:
・CPU性能自体はここ10年で飽和
・CPU動作周波数も変わっていない
◼ FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness, Tri Dao,
Daniel Y. Fu, Stefano Ermon, Atri Rudra, Christopher Ré
◼ AttentionはLLMで多様されるものの、その演算方法はGPU上で最適化されてない
◆MatMulといったレイヤ毎に全出力をメモリに書き出すのは非効率
◆→そこでAttentionを一つの演算ブロックにまとめ(Fusing)、さらに行列計算を分割するこ
と(Tiling)で可能な限り中間データをローカルメモリ内に留める
LLM研究例: FlashAttention
Kentaro Yoshioka(21/17)