$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
WebRTC と Rust と8K 60fps
Search
tnoho
November 27, 2025
Programming
2
2k
WebRTC と Rust と 8K 60fps
libwebrtc を Vibe Coding で制御したくて Rust で扱えるようにしてみました。あと 8K 60fps な WebRTC 送信装置を作ったので 8K 60fps やべぇ話です。
tnoho
November 27, 2025
Tweet
Share
More Decks by tnoho
See All by tnoho
P2P ではじめる WebRTC のつまづきどころ
tnoho
1
440
WebRTC と AI の組み合わせ
tnoho
0
890
WebRTC の映像を Python から自由に加工する sora-python-sdk の仕組み
tnoho
0
2k
Other Decks in Programming
See All in Programming
Context is King? 〜Verifiability時代とコンテキスト設計 / Beyond "Context is King"
rkaga
10
1.3k
AIコーディングエージェント(Manus)
kondai24
0
200
ハイパーメディア駆動アプリケーションとIslandアーキテクチャ: htmxによるWebアプリケーション開発と動的UIの局所的適用
nowaki28
0
440
実は歴史的なアップデートだと思う AWS Interconnect - multicloud
maroon1st
0
240
AIエンジニアリングのご紹介 / Introduction to AI Engineering
rkaga
8
3.2k
【Streamlit x Snowflake】データ基盤からアプリ開発・AI活用まで、すべてをSnowflake内で実現
ayumu_yamaguchi
1
120
Findy AI+の開発、運用におけるMCP活用事例
starfish719
0
1.5k
チームをチームにするEM
hitode909
0
350
re:Invent 2025 のイケてるサービスを紹介する
maroon1st
0
140
tsgolintはいかにしてtypescript-goの非公開APIを呼び出しているのか
syumai
7
2.3k
Navigation 3: 적응형 UI를 위한 앱 탐색
fornewid
1
420
LLMで複雑な検索条件アセットから脱却する!! 生成的検索インタフェースの設計論
po3rin
4
890
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.8k
Building Better People: How to give real-time feedback that sticks.
wjessup
370
20k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
160
Embracing the Ebb and Flow
colly
88
4.9k
Faster Mobile Websites
deanohume
310
31k
SEO in 2025: How to Prepare for the Future of Search
ipullrank
3
3.3k
Utilizing Notion as your number one productivity tool
mfonobong
2
180
Building a Modern Day E-commerce SEO Strategy
aleyda
45
8.3k
Side Projects
sachag
455
43k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.6k
KATA
mclloyd
PRO
33
15k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
390
Transcript
WebRTC と Rust と 8K 60fps tnoho
自己紹介 tnoho なんだかんだでずっとWebRTC 時雨堂の momo や Sora Python SDK の原作者
ずっとメンテしてる時雨堂の皆さん、すごいなーとみている
最近作ったもの • 8K 60fps • ミニPCサイズ • 110W なので。。。 •
8K 30fps / 4K 120fps • お弁当箱サイズ • 60W Type-C PD対応 中身はいつも通り libwebrtc ベースのネイティブアプリケーション
お問い合わせは ミサオネットワークまで ご不用品の引き取りもミサオネットワークまでw データ消去の証明書とかも出してくれます
libwebrtc + Rust
脱 momo 昨年展示した QIKENC8KP は時雨堂のネイティブ WebRTC クライアントである momo のカスタム でも、
8K や 4K の高画質を扱うと高画質なメインストリームの他に、 プレビューに使える低解像度なサブストリームが欲しくなる しかし、momo は1本しかストリームを扱えない よし、脱 momo だ! momo
C++ つらい WebRTC のライブラリだと一番リッチな libwebrtc を使いたい でも、 C++ は LLM
との相性が悪いのでイマイチ。。。 その上ストリームを複数本扱うとなると複雑になるのは確定 せめてもうちょっと LLM が得意な言語で書きたい そうだ!libwebrtc を Rust から扱えるようにしよう!
Sora Python SDK で目指したこと Sora Python SDK は自由度の高さとPythonの利便性の両立を狙った • WebRTC
の基本構造に忠実なクラス設計 ◦ Sora => PeerConnectionFactory ◦ SoraConnection => PeerConnection ◦ SoraVideoSource => VideoSource • 使う側がリソース管理を意識しないリソースマネージメント ◦ Pythonらしくつかえるように しかし、リソースマネージメントで課題に当たってしまった ※解消済みです
起こった問題 Pythonのガベージコレクションが意図した動きをせずに、 デッドロックやメモリーリーク、セグメンテーション違反を引き起こしてしまう ※すでに解消されています Sora ③ SoraConnection ① SoraVideoSource ②
AddTrack Sora SoraConnection SoraVideoSource AddTrack ①=>②=>③で消したい Python は最初に消そうとする 先に見るように伝える でも、先に消してくれない デッドロック or 循環参照でメモリーリーク 無理に消すとセグメンテーション違反 実際
どう解消したか もちろん、所有権に配慮して実装しているのに発生する どうしようもないので、DisposePublisher と DisposeSubscriber を作った Sora SoraConnection (Subscriber) SoraVideoSource
(Publisher) AddTrack Subscribe Publish Dispose 参照解除 これにより、PythonのGCとは独立してリソースマネージメントされる
生まれた負債と得られた教訓 結局Pythonのリファレンスカウンタとは別にリファレンス管理をすることとなり、メンテナ ンスコストが上がってしまった GCは信用できない、GCに依存した言語を使ってはならない C++サイドで親子関係のあるものの所有権管理を C++の外側でやろうとすると同じ問題に当たる可能性がある
実際のリソース管理は C++ 内で完結させる Rust SDK は弱参照を保持するイメージ これでリソースの解放は C++側の都合でできるので、 セグメンテーション違反はなくなる C++とRustのインターフェイスはフラットとし、
親子関係はRustの中で再構築する いずれは解放されるので問題がない Rust SDK でどうしたか Rust SDK C++ ライブラリ libwebrtc Rust クライアント リソース管理
これでシグナリングやPeerConnection制御は楽勝! あとは LLM に任せればいいぜ! だと、思っていたことが僕にもありました。 Q: WebRTC のシグナリングプロセスを文字だけで説明してください なお、 PeerConnection
は 2 本張るものとします。 あー。もう自分でプログラム書いた方が早くね。。。? でもまぁ、Rustにしたおかげでだいぶ楽になりました。WebSocketとか。
8K 60fps
8K 60fps の撮れるカメラって? 8K 120fps まで撮れる 業務用のカメラ • 出力は 12G
SDI ケーブル x 4 • 一人で持てないくらい重い • 光源が結構必要 ニコンの一眼Zシリーズの HDMIから8K 60fps出て欲しい。。。
8K の高解像度が生きるのは大画面 しかし大画面でフレームレートが低いと フレーム間の画の移動量が大きく感じる 結果的にカクついて見える なので、 8K 放送規格も 60fps !
8K 30fps で展示しても 30fps じゃなぁ。。。 って言われる。。。た。。。 なぜ 8K 60fps なのか
でも 8K 60fps って…? エンコーダに入力する 8K の I420 データは 7680
x 4320 x 1.5 byte だから。。。1フレーム 50 MB かぁ。。。 秒間 60 フレームだから。。。50 x 60 = 3000。。。1秒で3GB。。。 1秒で3GB!? やばい、全然いける気がしない。。。 ※元信号が「12G」 SDI 4 本という時点で察するべき
大体発生するピクセルフォーマット変換 カメラのセンサーやディスプレイの画面はRGBだけど、 伝送レートの都合から伝送はYUVで行われる しかし、このYUVの並び順はそれぞれの都合で違う • libwebrtc の中で扱われるピクセルフォーマットは I420 ◦ Y,U,VがそれぞれまとまっているのでCPUで処理する時に高速
• ハードウェアエンコーダーは大体 NV12 ◦ Y, UV(交互) I420に比べるとメモリ参照が2本で済む • キャプチャーカードは大体 YUY2 ◦ 縦方向の色を混ぜないのでリニアに処理できて映像機器が作りやすい
YUY2からNV12にする計算量を想像する 実際にやるのは • Y 取り出して並べるだけ • UV は取り出して 一つしたの行の UV
と足して並べる それを 8K 60 fps だと 7680 x 4320 x 3 = 約 20 億...2G…1命令で終わるわけないから CPUだとマルチコアでも、それだけで使い切る。。。
Q: じゃあどうするの? A: 全部ハードウェアでやるんだよ
こゆこと キャプチャーカード ハードウェアピクセル変換 ハードウェアエンコード libwebrtc さん 後よろ 解決
ほぼほぼフルスクラッチ できあがったもの Rust SDK C++ ライブラリ libwebrtc キャプチャーカード ハードウェア ピクセル変換
ハードウェア エンコーダー Rust クライアント
そんなこんなで 結構大変だったんですが 8K 60fps を達成 その技術を横展開するとQIKENC8KP も 安定性が向上 難しいことへのチャレンジは大切 というわけで
Vibe Coding での開発が可能な WebRTC Native Client ができました お貸し出しのリクエストは ミサオネットワークさんまで!
EOF できあがってみたら、あんまり参考にならない話でごめんなさい🙏 ご不用品の引き取りはミサオネットワークまでw データ消去の証明書とかも出してくれます #PR
カメラちゃんと選んでますか? • 光をちゃんと集めないとノイズまみれになってしまう ◦ 場所もレンズも明るい方が良い ◦ 明るいレンズは大きなレンズ ◦ センサーサイズも大きい方がよい ◦
じゃあ、解像度は?フレームレートは? • 小さなレンズほど磨くのは難しいし粗の影響が出る ◦ 工学的にはレンズは大きい方が綺麗に写る そのみなさんの手の中にある小さなカメラは、 果たして本当に書かれている解像度の性能がありますか?
じゃあ 4K, 8K が綺麗に撮れるカメラって イチオシはニコンの一眼レフ Nikon Z8 / Z9 •
HDMI から 4K 120fps / 8K 30fps が出力可 • 量販店で普通に買える • フルサイズの大きなセンサー • ニコンの明るく高精度なレンズ 皆さんが経費で買えるかもしれない一眼レフ! というか、買ってくれないと機能がなくなっちゃうかも。。。