Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サポーターズ 技育CAMPアドバンスVol.3
Search
Minimalist30
September 02, 2023
0
33
サポーターズ 技育CAMPアドバンスVol.3
2023年9月
サポーターズ主催の技育CAMPアドバンス Vol.3で発表した時に使用したスライド
発表時間:3分
Minimalist30
September 02, 2023
Tweet
Share
More Decks by Minimalist30
See All by Minimalist30
とやまローカルメディアハッカソン 2024
minimalist30
1
130
逆求人形式イベント 自己紹介
minimalist30
0
39
株式会社CARTA HOLDINGS インターンシップ
minimalist30
0
32
サポーターズ 技育CAMPキャラバン@金沢
minimalist30
0
34
サポーターズ LT会
minimalist30
0
23
Featured
See All Featured
Building a Scalable Design System with Sketch
lauravandoore
461
33k
BBQ
matthewcrist
87
9.5k
Why You Should Never Use an ORM
jnunemaker
PRO
55
9.2k
How GitHub (no longer) Works
holman
314
140k
Performance Is Good for Brains [We Love Speed 2024]
tammyeverts
7
660
YesSQL, Process and Tooling at Scale
rocio
172
14k
The Power of CSS Pseudo Elements
geoffreycrofte
75
5.5k
Optimizing for Happiness
mojombo
377
70k
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
30
2.3k
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
175
52k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
21
2.5k
Transcript
ZUNDAMON - X 初見ですがよろしくお願いします 中川航輝 由良太希斗 村上浩輔 平野碧生
01 ZUNDAMON-Xとは? 04 デモ 02 前回まで 03 アップデート 05 技術構成
06 技術挑戦 07 今後 本日の流れ
01 ZUNDAMON-Xとは? 海外の動画で勉強したい! ↓ でも... 英語は聞き取れない! 日本語字幕はすぐ見逃してしまう...
01 ZUNDAMON-Xとは? 可愛いキャラの声 で を 海外の動画 日本語 で聞けるサービス!! ぼ、僕がずんだもんなのだ... YouTubeを吹き替え!?
02 前回実装した機能 早送り、巻き戻ししてもちゃんと音声が聞ける! 125ヶ国もの言語の動画に対応! 字幕をリアルタイムで表示! Vtuberのように画面端にキャラがいる親近感! 1 1 2 2
3 3 4 4
YouTube公式から 翻訳 吹き替え機能が... ?! ?! 敵↓
1 1 18体のキャラクター と 喋り方のスタイル を追加! 2 2 感情分析 により、キャラの表情が変化!(5パターン)
3 3 より可愛く!よいユーザー体験を!UI/UXの改良 03 アップデート情報!
実践してみせるのだ!> 04 デモンストレーション
None
05 技術構成
05 技術構成
06 技術挑戦 1 を動画に間に合わせる 音声の生成 2 という環境 Chrome拡張 YouTubeとのデータのやり取り設計が難しい!! フロント・バックで音声生成の最適化
Reactと要領がぜんぜん違う! Chrome拡張での制約に大苦戦
状態管理 感情分析 同じ音声を生成しないよう、ローカルストレージで管理 音声生成のロジック 字幕の時間に合わせて 喋る速度を自動調整 喋る速度のロジック 状態管理の粒度に合わせて、 Recoil や
Chrome.Storage API を採用 Natural Langage API を使用し、 ポジティブ・ネガティブの感情を分析 06 技術挑戦
今年中のリリース を目標に!! DeepL APIなどにより、 高精度な翻訳 を実現 翻訳精度UP 字幕の適切な区切り 文脈から感情を分析 ChatGPT
の導入 声の生成を 並列化 し、 リリースする! リリースする! 07 今後の展望
終 開発・発表 ━━━━━ Ⓝ Ⓨ Ⓜ Ⓗ ご清聴ありがとう なのだ!!! 初見ですがよろしくお願いします