Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サポーターズ 技育CAMPアドバンスVol.3
Search
Minimalist30
September 02, 2023
74
0
Share
サポーターズ 技育CAMPアドバンスVol.3
2023年9月
サポーターズ主催の技育CAMPアドバンス Vol.3で発表した時に使用したスライド
発表時間:3分
Minimalist30
September 02, 2023
More Decks by Minimalist30
See All by Minimalist30
とやまローカルメディアハッカソン 2024
minimalist30
1
180
逆求人形式イベント 自己紹介
minimalist30
0
59
株式会社CARTA HOLDINGS インターンシップ
minimalist30
0
57
授業_IoTプログラミング_発表資料
minimalist30
0
6
サポーターズ 技育CAMPキャラバン@金沢
minimalist30
0
73
サポーターズ LT会
minimalist30
0
34
Featured
See All Featured
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
KATA
mclloyd
PRO
35
15k
The Pragmatic Product Professional
lauravandoore
37
7.2k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
190
The Language of Interfaces
destraynor
162
26k
The AI Search Optimization Roadmap by Aleyda Solis
aleyda
1
5.6k
We Analyzed 250 Million AI Search Results: Here's What I Found
joshbly
1
1.1k
Information Architects: The Missing Link in Design Systems
soysaucechin
0
870
How To Speak Unicorn (iThemes Webinar)
marktimemedia
1
430
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
660
SEO Brein meetup: CTRL+C is not how to scale international SEO
lindahogenes
1
2.5k
Scaling GitHub
holman
464
140k
Transcript
ZUNDAMON - X 初見ですがよろしくお願いします 中川航輝 由良太希斗 村上浩輔 平野碧生
01 ZUNDAMON-Xとは? 04 デモ 02 前回まで 03 アップデート 05 技術構成
06 技術挑戦 07 今後 本日の流れ
01 ZUNDAMON-Xとは? 海外の動画で勉強したい! ↓ でも... 英語は聞き取れない! 日本語字幕はすぐ見逃してしまう...
01 ZUNDAMON-Xとは? 可愛いキャラの声 で を 海外の動画 日本語 で聞けるサービス!! ぼ、僕がずんだもんなのだ... YouTubeを吹き替え!?
02 前回実装した機能 早送り、巻き戻ししてもちゃんと音声が聞ける! 125ヶ国もの言語の動画に対応! 字幕をリアルタイムで表示! Vtuberのように画面端にキャラがいる親近感! 1 1 2 2
3 3 4 4
YouTube公式から 翻訳 吹き替え機能が... ?! ?! 敵↓
1 1 18体のキャラクター と 喋り方のスタイル を追加! 2 2 感情分析 により、キャラの表情が変化!(5パターン)
3 3 より可愛く!よいユーザー体験を!UI/UXの改良 03 アップデート情報!
実践してみせるのだ!> 04 デモンストレーション
None
05 技術構成
05 技術構成
06 技術挑戦 1 を動画に間に合わせる 音声の生成 2 という環境 Chrome拡張 YouTubeとのデータのやり取り設計が難しい!! フロント・バックで音声生成の最適化
Reactと要領がぜんぜん違う! Chrome拡張での制約に大苦戦
状態管理 感情分析 同じ音声を生成しないよう、ローカルストレージで管理 音声生成のロジック 字幕の時間に合わせて 喋る速度を自動調整 喋る速度のロジック 状態管理の粒度に合わせて、 Recoil や
Chrome.Storage API を採用 Natural Langage API を使用し、 ポジティブ・ネガティブの感情を分析 06 技術挑戦
今年中のリリース を目標に!! DeepL APIなどにより、 高精度な翻訳 を実現 翻訳精度UP 字幕の適切な区切り 文脈から感情を分析 ChatGPT
の導入 声の生成を 並列化 し、 リリースする! リリースする! 07 今後の展望
終 開発・発表 ━━━━━ Ⓝ Ⓨ Ⓜ Ⓗ ご清聴ありがとう なのだ!!! 初見ですがよろしくお願いします