Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Search
Tenstorrent Japan
October 29, 2025
0
110
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Tenstorrent TechTalk #4, LT1
Tenstorrent Japan
October 29, 2025
Tweet
Share
More Decks by Tenstorrent Japan
See All by Tenstorrent Japan
お外でBlackhole
tenstorrent_japan
0
97
Go Out with Blackhole
tenstorrent_japan
0
94
MLIRベースのコンパイラ TT-Forge/TT-MLIRの解説
tenstorrent_japan
0
96
Blackhole Architecture
tenstorrent_japan
0
85
Tenstorrent 手軽にAIアプリケーションを立ち上げる
tenstorrent_japan
0
160
TT-TransformersとCursorのAI Agent連携
tenstorrent_japan
0
170
BlackholeおよびTensixアーキテクチャのNoCを用いたデータ転送
tenstorrent_japan
1
300
TT-Metaliumによるカーネルプログラミング
tenstorrent_japan
1
300
Tenstorrent HW/SW 概要説明
tenstorrent_japan
1
1.1k
Featured
See All Featured
[RailsConf 2023] Rails as a piece of cake
palkan
57
6k
Designing for humans not robots
tammielis
254
26k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
230
22k
Six Lessons from altMBA
skipperchong
29
4k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.5k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
162
15k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
1.7k
Automating Front-end Workflow
addyosmani
1371
200k
The Art of Programming - Codeland 2020
erikaheidi
56
14k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.5k
The Language of Interfaces
destraynor
162
25k
The Invisible Side of Design
smashingmag
302
51k
Transcript
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話 大原 遼太郎 漆原 聖仁
自己紹介 とり天(本名:大原 遼太郎) X:@NoOne_1024 職業:半導体屋さん 好きなもの:計算機全般、特にGPGPUや AIチップ、アクセラレータが好き。 実は博士(工学)だったりする。 GPGPU 自称世界最高精度最小電力の Bluetooth
時刻同期システム SRAM設計
共同研究者紹介 漆原聖仁(Urushibara Masato) X: @niwatoriv2 職業:高校生(1年次) 好きなもの:計算機(折角なので作りたい ) ひとこと: 高校生ですが何卒よろしくお願いします。
Numpyのビルドシステムを理解しようと頑張ってます。笑 それとBlackhole欲しくなってきました 良い写真がなかったので代理
RISC-V Vector Extention v1.0とは? RISC-Vのベクトル拡張命令のバージョン1.0 Q. SIMDとの違いは A. ベクトルのレジスタサイズが固定ではない。 ベクトル長が可変なのでAVX512⇛AVX2のようなベクトル長が変わる
変更で再コンパイルが不要(バイナリ互換)
Q.なぜRVV1.0をやろうとしていたのか? A. NumPyの超越関数の高速化に取り組んでいたから。 富士通の研究者によって富岳上で NumPyがSVEにより高速化できることが示されていた。 SVEとRVVは同じ可変長ベクトルで 親戚みたいなもの! これで銅鉄研究(似た性質の対象でや る焼き直しの研究)をやろう! 富岳の
富士通A64FX SVEでNumPy の超越関数が最大 24.3倍高速化 できる 山田, 芙夕楓, 川上, 健太郎, 栗原, 康志, 松田, 一仁, 田原, 司睦, 2022: 情報処理学会, 1–6 p. しかし
既存のRVV1.0をサポートしたプロセッサは少ない Milk-V Jupiter • SoC: SpacemiT M1(SpacemiT
[email protected]
) • RAM:
16GB LPDDR4X • SSD: 500GB M.2 NVMe • 👍RVV 1.0準拠(256 bit vector) これ以外だと個人で買えそうな RVV1.0対応プロセッサはあまり 見つからない(K230くらい?)
思ったほど早くならない 富岳の論文に習い初等関数ライブラリ SLEEでのスカラに対する性能向上を計測 A64FXは無調整の SLEEFで6倍の高速化を達成していた。
(全然話は変わるが) なぜか無関係にBlackhole買っていた Q. なぜBlackholeを買っていたのか A. カッコいいからです(箱からしてカッコいい) • ローカルLLMとかやってみたかった。 • 多体問題とか計算して遊びたかった
私のBlackholeマシン 16777216色🌈に光らないだけでもうカッコいいha-toBlackhole Ubuntu 22.04.5 LTS Blackhole : p100a CPU :Core i5-14500
RAM :DDR4 64GB マザボ:PCI Express 5.0 x16☆ 電源 :ATX 3.1☆ ☆は重要な点
ある日X.comを見ていると これ以降私の BlackholeマシンはRVV1.0実験の専用機と化す ⁉
Blackhole内のx280 • SiFive X280CPU • 4コアが4セット • 512-bit VLEN/256-bit DLEN
• RVV 1.0準拠
△RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
◎RVV1.0で遊ぼうと思ったら (気づかないうちに) x280を買っていた話
X280における実験結果と比較 • 平均で2倍以上の性能向上 SpacemiT K1の向上率を平均で1.36倍上回る性能♪ • でも富岳には全然勝てない (´;ω;`)
今後の予定 NumPyへの統合 まだ、開発環境の整備やライブラリの準備しかできてない。 さらなる最適化 富士通の論文ではアンローリングやパイプライニングで高速化できる ことが示されている。それらも取り込む。 Tensix CoreでもNumpy TensixにもCupyみたいにNumPyを生やしたい (でも、そのためにはBLASが...)
ご静聴ありがとうございました
絶対性能比較