Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Tenstorrent Japan
October 29, 2025
0
270
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
Tenstorrent TechTalk #4, LT1
Tenstorrent Japan
October 29, 2025
Tweet
Share
More Decks by Tenstorrent Japan
See All by Tenstorrent Japan
TT-NN 概要 ~内部実装の概説
tenstorrent_japan
0
120
TTNNモデル実装 実践編 ~PytorchモデルのTTNN移植から最適化まで~
tenstorrent_japan
0
120
お外でBlackhole
tenstorrent_japan
0
240
Go Out with Blackhole
tenstorrent_japan
0
280
MLIRベースのコンパイラ TT-Forge/TT-MLIRの解説
tenstorrent_japan
0
210
Blackhole Architecture
tenstorrent_japan
0
200
Tenstorrent 手軽にAIアプリケーションを立ち上げる
tenstorrent_japan
0
200
TT-TransformersとCursorのAI Agent連携
tenstorrent_japan
0
210
BlackholeおよびTensixアーキテクチャのNoCを用いたデータ転送
tenstorrent_japan
1
370
Featured
See All Featured
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.2k
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
0
2.3k
The Success of Rails: Ensuring Growth for the Next 100 Years
eileencodes
47
7.9k
The Impact of AI in SEO - AI Overviews June 2024 Edition
aleyda
5
720
Abbi's Birthday
coloredviolet
1
4.7k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
9.5k
Leveraging LLMs for student feedback in introductory data science courses - posit::conf(2025)
minecr
0
140
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.3k
JavaScript: Past, Present, and Future - NDC Porto 2020
reverentgeek
52
5.8k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
1
1.4k
Ethics towards AI in product and experience design
skipperchong
2
190
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.4k
Transcript
RVV1.0で遊ぼうと思ったら Blackholeを買っていた話 大原 遼太郎 漆原 聖仁
自己紹介 とり天(本名:大原 遼太郎) X:@NoOne_1024 職業:半導体屋さん 好きなもの:計算機全般、特にGPGPUや AIチップ、アクセラレータが好き。 実は博士(工学)だったりする。 GPGPU 自称世界最高精度最小電力の Bluetooth
時刻同期システム SRAM設計
共同研究者紹介 漆原聖仁(Urushibara Masato) X: @niwatoriv2 職業:高校生(1年次) 好きなもの:計算機(折角なので作りたい ) ひとこと: 高校生ですが何卒よろしくお願いします。
Numpyのビルドシステムを理解しようと頑張ってます。笑 それとBlackhole欲しくなってきました 良い写真がなかったので代理
RISC-V Vector Extention v1.0とは? RISC-Vのベクトル拡張命令のバージョン1.0 Q. SIMDとの違いは A. ベクトルのレジスタサイズが固定ではない。 ベクトル長が可変なのでAVX512⇛AVX2のようなベクトル長が変わる
変更で再コンパイルが不要(バイナリ互換)
Q.なぜRVV1.0をやろうとしていたのか? A. NumPyの超越関数の高速化に取り組んでいたから。 富士通の研究者によって富岳上で NumPyがSVEにより高速化できることが示されていた。 SVEとRVVは同じ可変長ベクトルで 親戚みたいなもの! これで銅鉄研究(似た性質の対象でや る焼き直しの研究)をやろう! 富岳の
富士通A64FX SVEでNumPy の超越関数が最大 24.3倍高速化 できる 山田, 芙夕楓, 川上, 健太郎, 栗原, 康志, 松田, 一仁, 田原, 司睦, 2022: 情報処理学会, 1–6 p. しかし
既存のRVV1.0をサポートしたプロセッサは少ない Milk-V Jupiter • SoC: SpacemiT M1(SpacemiT
[email protected]
) • RAM:
16GB LPDDR4X • SSD: 500GB M.2 NVMe • 👍RVV 1.0準拠(256 bit vector) これ以外だと個人で買えそうな RVV1.0対応プロセッサはあまり 見つからない(K230くらい?)
思ったほど早くならない 富岳の論文に習い初等関数ライブラリ SLEEでのスカラに対する性能向上を計測 A64FXは無調整の SLEEFで6倍の高速化を達成していた。
(全然話は変わるが) なぜか無関係にBlackhole買っていた Q. なぜBlackholeを買っていたのか A. カッコいいからです(箱からしてカッコいい) • ローカルLLMとかやってみたかった。 • 多体問題とか計算して遊びたかった
私のBlackholeマシン 16777216色🌈に光らないだけでもうカッコいいha-toBlackhole Ubuntu 22.04.5 LTS Blackhole : p100a CPU :Core i5-14500
RAM :DDR4 64GB マザボ:PCI Express 5.0 x16☆ 電源 :ATX 3.1☆ ☆は重要な点
ある日X.comを見ていると これ以降私の BlackholeマシンはRVV1.0実験の専用機と化す ⁉
Blackhole内のx280 • SiFive X280CPU • 4コアが4セット • 512-bit VLEN/256-bit DLEN
• RVV 1.0準拠
△RVV1.0で遊ぼうと思ったら Blackholeを買っていた話
◎RVV1.0で遊ぼうと思ったら (気づかないうちに) x280を買っていた話
X280における実験結果と比較 • 平均で2倍以上の性能向上 SpacemiT K1の向上率を平均で1.36倍上回る性能♪ • でも富岳には全然勝てない (´;ω;`)
今後の予定 NumPyへの統合 まだ、開発環境の整備やライブラリの準備しかできてない。 さらなる最適化 富士通の論文ではアンローリングやパイプライニングで高速化できる ことが示されている。それらも取り込む。 Tensix CoreでもNumpy TensixにもCupyみたいにNumPyを生やしたい (でも、そのためにはBLASが...)
ご静聴ありがとうございました
絶対性能比較