Upgrade to PRO for Only $50/Year—Limited-Time Offer! 🔥
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Search
Tenstorrent Japan
October 29, 2025
0
240
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Tenstorrent TechTalk #4, LT1
Tenstorrent Japan
October 29, 2025
Tweet
Share
More Decks by Tenstorrent Japan
See All by Tenstorrent Japan
お外でBlackhole
tenstorrent_japan
0
180
Go Out with Blackhole
tenstorrent_japan
0
190
MLIRベースのコンパイラ TT-Forge/TT-MLIRの解説
tenstorrent_japan
0
180
Blackhole Architecture
tenstorrent_japan
0
170
Tenstorrent 手軽にAIアプリケーションを立ち上げる
tenstorrent_japan
0
170
TT-TransformersとCursorのAI Agent連携
tenstorrent_japan
0
180
BlackholeおよびTensixアーキテクチャのNoCを用いたデータ転送
tenstorrent_japan
1
340
TT-Metaliumによるカーネルプログラミング
tenstorrent_japan
1
350
Tenstorrent HW/SW 概要説明
tenstorrent_japan
2
1.3k
Featured
See All Featured
The Illustrated Children's Guide to Kubernetes
chrisshort
51
51k
Why You Should Never Use an ORM
jnunemaker
PRO
61
9.6k
How to Ace a Technical Interview
jacobian
280
24k
Designing Experiences People Love
moore
143
24k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.7k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
132
19k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.3k
It's Worth the Effort
3n
187
29k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
12
1.3k
How to Think Like a Performance Engineer
csswizardry
28
2.4k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
970
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.3k
Transcript
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話 大原 遼太郎 漆原 聖仁
自己紹介 とり天(本名:大原 遼太郎) X:@NoOne_1024 職業:半導体屋さん 好きなもの:計算機全般、特にGPGPUや AIチップ、アクセラレータが好き。 実は博士(工学)だったりする。 GPGPU 自称世界最高精度最小電力の Bluetooth
時刻同期システム SRAM設計
共同研究者紹介 漆原聖仁(Urushibara Masato) X: @niwatoriv2 職業:高校生(1年次) 好きなもの:計算機(折角なので作りたい ) ひとこと: 高校生ですが何卒よろしくお願いします。
Numpyのビルドシステムを理解しようと頑張ってます。笑 それとBlackhole欲しくなってきました 良い写真がなかったので代理
RISC-V Vector Extention v1.0とは? RISC-Vのベクトル拡張命令のバージョン1.0 Q. SIMDとの違いは A. ベクトルのレジスタサイズが固定ではない。 ベクトル長が可変なのでAVX512⇛AVX2のようなベクトル長が変わる
変更で再コンパイルが不要(バイナリ互換)
Q.なぜRVV1.0をやろうとしていたのか? A. NumPyの超越関数の高速化に取り組んでいたから。 富士通の研究者によって富岳上で NumPyがSVEにより高速化できることが示されていた。 SVEとRVVは同じ可変長ベクトルで 親戚みたいなもの! これで銅鉄研究(似た性質の対象でや る焼き直しの研究)をやろう! 富岳の
富士通A64FX SVEでNumPy の超越関数が最大 24.3倍高速化 できる 山田, 芙夕楓, 川上, 健太郎, 栗原, 康志, 松田, 一仁, 田原, 司睦, 2022: 情報処理学会, 1–6 p. しかし
既存のRVV1.0をサポートしたプロセッサは少ない Milk-V Jupiter • SoC: SpacemiT M1(SpacemiT
[email protected]
) • RAM:
16GB LPDDR4X • SSD: 500GB M.2 NVMe • 👍RVV 1.0準拠(256 bit vector) これ以外だと個人で買えそうな RVV1.0対応プロセッサはあまり 見つからない(K230くらい?)
思ったほど早くならない 富岳の論文に習い初等関数ライブラリ SLEEでのスカラに対する性能向上を計測 A64FXは無調整の SLEEFで6倍の高速化を達成していた。
(全然話は変わるが) なぜか無関係にBlackhole買っていた Q. なぜBlackholeを買っていたのか A. カッコいいからです(箱からしてカッコいい) • ローカルLLMとかやってみたかった。 • 多体問題とか計算して遊びたかった
私のBlackholeマシン 16777216色🌈に光らないだけでもうカッコいいha-toBlackhole Ubuntu 22.04.5 LTS Blackhole : p100a CPU :Core i5-14500
RAM :DDR4 64GB マザボ:PCI Express 5.0 x16☆ 電源 :ATX 3.1☆ ☆は重要な点
ある日X.comを見ていると これ以降私の BlackholeマシンはRVV1.0実験の専用機と化す ⁉
Blackhole内のx280 • SiFive X280CPU • 4コアが4セット • 512-bit VLEN/256-bit DLEN
• RVV 1.0準拠
△RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
◎RVV1.0で遊ぼうと思ったら (気づかないうちに) x280を買っていた話
X280における実験結果と比較 • 平均で2倍以上の性能向上 SpacemiT K1の向上率を平均で1.36倍上回る性能♪ • でも富岳には全然勝てない (´;ω;`)
今後の予定 NumPyへの統合 まだ、開発環境の整備やライブラリの準備しかできてない。 さらなる最適化 富士通の論文ではアンローリングやパイプライニングで高速化できる ことが示されている。それらも取り込む。 Tensix CoreでもNumpy TensixにもCupyみたいにNumPyを生やしたい (でも、そのためにはBLASが...)
ご静聴ありがとうございました
絶対性能比較