2021年未踏ジュニア成果報告「動画編集ソフトウェアフレームワーク: mock up」

Slide 1

Slide 1 text

中間言語 muml による動画生成 1. プラグインにより拡張可能 2. Web技術ベースの動画編集 3. 動画編集ソフトウェアフレームワーク 1

Slide 2

Slide 2 text

自己紹介浅田睦葉 (momeemt) 都立桜修館中等教育学校 6年 Twitter, GitHub: @momeemt 2

Slide 3

Slide 3 text

目次・開発の背景・Mockupの提案する編集手法・考えられるMockupの応用先・フレームに対する処理・レンダリング高速化・プレビュー＋デモ・苦労したこと・今後取り組んでいくこと・mock upによって実現する未来・まとめ 3

Slide 4

Slide 4 text

開発の背景動画編集は難しい 2020年度 SecHack365 ブロックを用いて編集する動画編集ソフトウェアを開発簡単に動画編集ソフトを作りたい動画編集ソフトを作るのは難しい 2021年度 Mitou Jr 文化祭での動画作成 4

Slide 5

Slide 5 text

開発の背景動画編集ソフトウェア開発のタスクを共通化してフレームワークにしたい！動画のデコード/エンコード、図形描画、テキスト描画、座標系の定義、拡大縮小、様々なメディアフォーマットへの対応、トリミング、ネガポジ反転、ゆがみ、ぼかし、アニメーション、部分適用、 3Dオブジェクト、その他フィルター、新しい動画編集ソフトウェアとしての革新的/独自の機能、レンダリング高速化、プレビュー、スクリプト、プラグイン拡張、音声処理、ソフトウェアとしての設計、ユーザーインターフェース、ユーザー体験の改善、ユーザーテスト、それらの分析... etc. 5 動画編集ソフトウェア開発を抽象化する

Slide 6

Slide 6 text

Webベースで動作する動画編集フレームワーク Mockupの提案する編集手法 Web技術ベースでこれらの機能を手軽に利用したい様々な環境で利用ができる Webサービスの動画編集バックエンド高性能とも限らないモバイルでの動画編集バックエンド Electron等で動かせばローカルでも利用可能 → UI等はアプリに適したものを開発してもらい、様々な環境から利用できる拡張可能な動画編集フレームワーク　 6

Slide 7

Slide 7 text

Mockupの提案する編集手法 → 差分更新については「これから取り組んでいくこと」で再度触れますシンプルなRESTful APIではなく中間言語muml ① 大量のAPIを管理したくない ② 差分の関心を後回しにできる 20種類のフィルターをかけるなら 20個のエンドポイントを叩かなければいけないので辛い差分更新の実装を後回しにできる未踏ジュニア期間内では全ての要素を再レンダリングしている再レンダリング必要なのかそうでないのかが分からない 7

Slide 8

Slide 8 text

Mockupの提案する編集手法 input output 色反転フィルターをかけるmumlの例 8

Slide 9

Slide 9 text

Mockupの提案する編集手法 Web開発者・UI/UXの改善に取り組む・mumlを投げるだけ動画編集機能開発者・レンダラを拡張する・Web APIを意識しないでok mumlによって2種の開発者がシームレスに協業できる 9

Slide 10

Slide 10 text

Mockupの提案する編集手法 APIも用意されている update preview upload (今後) 動画編集の内容に関係ない部分のみREST API encode mumlを更新するエンコードするプレビューするリソースを追加する 10

Slide 11

Slide 11 text

Mockupの提案する編集手法 Web API CLIツール画像動画 11 類似システムとの比較

Slide 12

Slide 12 text

Twitter 考えられるMockupの応用先投稿時に簡単な編集ができるサービスに即した動画編集機能 ▲ 画像をトリミングできる 12

Slide 13

Slide 13 text

▲ 時刻が連動した動画を流すプロモーションビデオ thechoiceisyours.whatisthematrix.com/jp/ 考えられるMockupの応用先プログラマブルな動画編集 13 ▲ ゲームの状態を取得して合成する

Slide 14

Slide 14 text

web 開発者モバイルアプリデスクトップアプリ muml フレームをテクスチャに変換 FFmpeg 技術構成リソース (画像,動画,フォントなど) ... FFmpeg レンダリングテクスチャを取得フレームに変換ストリーミングの初期化・配信動画ファイルへ書き出し rtmpサーバー mumlのパース timeline obj生成必要なシェーダファイルの準備動画像のデコードプレビュー用ライブストリームエンコード済み動画 14

Slide 15

Slide 15 text

フレームに対する処理 mumlは単なるルールであって、 YAML, JSONなどどんな構造で扱っても良いが、 update APIではJSONとして受け取る ↓ 単にJSONをパースしてタイムラインオブジェクトを作成する ① mumlのパース 15

Slide 16

Slide 16 text

フレームに対する処理動画像のデコード ② タイムラインが必要な機能を要求するタイムラインオブジェクトから描画に必要な要素を生成する 16 FFmpegの初期化フォントデータの読み込み FreeTypeの初期化

Slide 17

Slide 17 text

③ レンダラーがフレームに対して処理を加えるフレームに対する処理 17 空のフレームに動画フレームが合成されたり、フォントデータが合成されることでレンダリングが行われる図形の描画テキストの描画動画像の描画

Slide 18

Slide 18 text

レンダリング高速化 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 2 3 3 3 3 3 3 4 2 3 3 3 4 4 4 4 CPUに動画を処理させるのは低速ピクセルは縦 x 横 x 4 (RGBA) 分のデータを持つ大雑把に言うと1920 x 1080のフレームで、 30fps・1分の動画のピクセルに全てアクセスする場合 1920 x 1080 x 4 x 30 x 60 = 約149億回の計算が必要！実際には複数個の素材を重ねるためさらに数倍になる 18

Slide 19

Slide 19 text

CPU GPU 0 50 100 150 200 250 300 350 レンダリング高速化現実的な速度でレンダリング可能に約11.5倍の高速化 1080 x 720 30fps 30秒程度の動画に二値化フィルターを掛けてエンコードを行った際の測定結果・これまでCPUでは320秒程度かかっていたエンコードが GPUの処理に変更すると25秒程度に改善・特にプレビューの実現が現実的になった 19

Slide 20

Slide 20 text

レンダリング高速化実装: FFmpegの構造をOpenGLに渡すリソースの準備（動画像のデコード・フォントデータの読み込み）はFFmpegで行うフレームピクセルの色データテクスチャ 20 シェーダーの適用

Slide 21

Slide 21 text

プレビューの実装 PREVIEW RTMPサーバーフレームを送り続けるフレーム 21 (今後) HTTP Live Streaming ブラウザ上でプレビュー

Slide 22

Slide 22 text

DEMO 22

Slide 23

Slide 23 text

苦労したこと・GPUで高速化する必要があったこと・AVFrameを直接Swscaleにかけると壊れた　→ フレームは必ず新しく確保し直す・int, floatでメモリを確保するとメモリ数が環境依存になり厳密でないのでOpenGLからフレームを読み出すときに壊れてしまう　→ 確保するメモリサイズは注意深く確認するこれまで苦労したことこれから苦労しそうなこと 23 ・FFmpegのアプリケーションに依存せずフレームをストリーミングすること・HTTP Live Streamingへの変換を自前で実装する必要があること

Slide 24

Slide 24 text

これから取り組んでいくこと OpenFXへの対応概要 24 エフェクト・合成プラグインの標準プレビューの利便性向上差分更新の実装より高速にレンダリングを行いたいインタラクティブなプレビューの実装

Slide 25

Slide 25 text

差分更新の実装・現在はmumlがupdateされるごとに全てのフレームを再レンダリングしている　→ 効率が悪い！・フレーム規模、レイヤー規模、ピクセル規模と段階的に差分更新を実現していく　→ 高速化が見込める 25 これから取り組んでいくこと差分更新

Slide 26

Slide 26 text

mock upによって実現する未来・絵コンテによるモーショングラフィックスの生成・声による撮影 + 編集・プログラマブルな動画編集のためのドメイン固有言語・オブジェクトの関係性に着目した動画編集新しい編集手法の探究 mock upを用いた開発・Webサービスのメディア編集・時刻や環境に依存して変化するWebサイト・動画編集Progressive Web Apps ・複数人編集可能なアプリケーションニーズに合わせて動画編集ソフトウェアを開発できる時代が来る 26

Slide 27

Slide 27 text

まとめ 27 ▲ GitHub ・RESTful APIではなく中間言語で編集することで大量のAPIを管理する必要がなく、差分更新について後回しにすることができる。出力やストリーミング、アップロードなど編集以外の作業と編集そのものを分離できる・フィルターや図形の描画、アニメーションについて表現でき、これらを組み合わせることで複雑な動画を作ることができる・OpenGLを用いてエンコードを約11.5倍高速化（動画像の構成要素によって変化）・RTMPサーバーにフレームを送信してプレビューを実装した・今後はOpenFXへの対応、差分更新の実装、インタラクティブなプレビューの実装にも取り組んでいく

Slide 28

Slide 28 text

① フレーム規模更新がないフレームの再レンダリングを行わない差分更新の実装・現在はmumlがupdateされるごとに全てのフレームを再レンダリングしている　→ 効率が悪い！・フレーム規模、レイヤー規模、ピクセル規模と段階的に差分更新を実現していく 28 これから取り組んでいくこと差分更新

Slide 29

Slide 29 text

① フレーム規模更新がないフレームの再レンダリングを行わない ② レイヤー規模差分が既レンダリング構成要素より高い要素の再レンダリングを行わない差分更新の実装・現在はmumlがupdateされるごとに全てのフレームを再レンダリングしている　→ 効率が悪い！・フレーム規模、レイヤー規模、ピクセル規模と段階的に差分更新を実現していく 29 これから取り組んでいくこと差分更新

Slide 30

Slide 30 text

① フレーム規模更新がないフレームの再レンダリングを行わない ② レイヤー規模差分が既レンダリング構成要素より高い要素の再レンダリングを行わない ③ ピクセル規模差分のうち既レンダリング要素より高い構成要素のピクセルは再レンダリングを行わない差分更新の実装・現在はmumlがupdateされるごとに全てのフレームを再レンダリングしている　→ 効率が悪い！・フレーム規模、レイヤー規模、ピクセル規模と段階的に差分更新を実現していく差分更新