Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Search
Tenstorrent Japan
October 29, 2025
350
0
Share
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Tenstorrent TechTalk #4, LT1
Tenstorrent Japan
October 29, 2025
More Decks by Tenstorrent Japan
See All by Tenstorrent Japan
TTデバイス間通信を支えるTT-Fablic解説 Part1
tenstorrent_japan
0
110
TT Korea OSS Program Overview
tenstorrent_japan
0
95
RISC-V CPU「TT-Ascalon」
tenstorrent_japan
0
330
TT OSS Developer Program in Japan
tenstorrent_japan
0
570
TT-NN 概要 ~内部実装の概説
tenstorrent_japan
0
200
TTNNモデル実装 実践編 ~PytorchモデルのTTNN移植から最適化まで~
tenstorrent_japan
0
180
お外でBlackhole
tenstorrent_japan
0
310
Go Out with Blackhole
tenstorrent_japan
0
350
MLIRベースのコンパイラ TT-Forge/TT-MLIRの解説
tenstorrent_japan
0
280
Featured
See All Featured
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
46
2.8k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
130
Art, The Web, and Tiny UX
lynnandtonic
304
21k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.4k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
820
How Fast Is Fast Enough? [PerfNow 2025]
tammyeverts
3
550
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.7k
Done Done
chrislema
186
16k
HDC tutorial
michielstock
2
640
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
480
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
We Have a Design System, Now What?
morganepeng
55
8.1k
Transcript
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話 大原 遼太郎 漆原 聖仁
自己紹介 とり天(本名:大原 遼太郎) X:@NoOne_1024 職業:半導体屋さん 好きなもの:計算機全般、特にGPGPUや AIチップ、アクセラレータが好き。 実は博士(工学)だったりする。 GPGPU 自称世界最高精度最小電力の Bluetooth
時刻同期システム SRAM設計
共同研究者紹介 漆原聖仁(Urushibara Masato) X: @niwatoriv2 職業:高校生(1年次) 好きなもの:計算機(折角なので作りたい ) ひとこと: 高校生ですが何卒よろしくお願いします。
Numpyのビルドシステムを理解しようと頑張ってます。笑 それとBlackhole欲しくなってきました 良い写真がなかったので代理
RISC-V Vector Extention v1.0とは? RISC-Vのベクトル拡張命令のバージョン1.0 Q. SIMDとの違いは A. ベクトルのレジスタサイズが固定ではない。 ベクトル長が可変なのでAVX512⇛AVX2のようなベクトル長が変わる
変更で再コンパイルが不要(バイナリ互換)
Q.なぜRVV1.0をやろうとしていたのか? A. NumPyの超越関数の高速化に取り組んでいたから。 富士通の研究者によって富岳上で NumPyがSVEにより高速化できることが示されていた。 SVEとRVVは同じ可変長ベクトルで 親戚みたいなもの! これで銅鉄研究(似た性質の対象でや る焼き直しの研究)をやろう! 富岳の
富士通A64FX SVEでNumPy の超越関数が最大 24.3倍高速化 できる 山田, 芙夕楓, 川上, 健太郎, 栗原, 康志, 松田, 一仁, 田原, 司睦, 2022: 情報処理学会, 1–6 p. しかし
既存のRVV1.0をサポートしたプロセッサは少ない Milk-V Jupiter • SoC: SpacemiT M1(SpacemiT
[email protected]
) • RAM:
16GB LPDDR4X • SSD: 500GB M.2 NVMe • 👍RVV 1.0準拠(256 bit vector) これ以外だと個人で買えそうな RVV1.0対応プロセッサはあまり 見つからない(K230くらい?)
思ったほど早くならない 富岳の論文に習い初等関数ライブラリ SLEEでのスカラに対する性能向上を計測 A64FXは無調整の SLEEFで6倍の高速化を達成していた。
(全然話は変わるが) なぜか無関係にBlackhole買っていた Q. なぜBlackholeを買っていたのか A. カッコいいからです(箱からしてカッコいい) • ローカルLLMとかやってみたかった。 • 多体問題とか計算して遊びたかった
私のBlackholeマシン 16777216色🌈に光らないだけでもうカッコいいha-toBlackhole Ubuntu 22.04.5 LTS Blackhole : p100a CPU :Core i5-14500
RAM :DDR4 64GB マザボ:PCI Express 5.0 x16☆ 電源 :ATX 3.1☆ ☆は重要な点
ある日X.comを見ていると これ以降私の BlackholeマシンはRVV1.0実験の専用機と化す ⁉
Blackhole内のx280 • SiFive X280CPU • 4コアが4セット • 512-bit VLEN/256-bit DLEN
• RVV 1.0準拠
△RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
◎RVV1.0で遊ぼうと思ったら (気づかないうちに) x280を買っていた話
X280における実験結果と比較 • 平均で2倍以上の性能向上 SpacemiT K1の向上率を平均で1.36倍上回る性能♪ • でも富岳には全然勝てない (´;ω;`)
今後の予定 NumPyへの統合 まだ、開発環境の整備やライブラリの準備しかできてない。 さらなる最適化 富士通の論文ではアンローリングやパイプライニングで高速化できる ことが示されている。それらも取り込む。 Tensix CoreでもNumpy TensixにもCupyみたいにNumPyを生やしたい (でも、そのためにはBLASが...)
ご静聴ありがとうございました
絶対性能比較