Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サポーターズ 技育CAMPアドバンスVol.3
Search
Minimalist30
September 02, 2023
0
65
サポーターズ 技育CAMPアドバンスVol.3
2023年9月
サポーターズ主催の技育CAMPアドバンス Vol.3で発表した時に使用したスライド
発表時間:3分
Minimalist30
September 02, 2023
Tweet
Share
More Decks by Minimalist30
See All by Minimalist30
とやまローカルメディアハッカソン 2024
minimalist30
1
150
逆求人形式イベント 自己紹介
minimalist30
0
54
株式会社CARTA HOLDINGS インターンシップ
minimalist30
0
41
授業_IoTプログラミング_発表資料
minimalist30
0
2
サポーターズ 技育CAMPキャラバン@金沢
minimalist30
0
53
サポーターズ LT会
minimalist30
0
30
Featured
See All Featured
Building Flexible Design Systems
yeseniaperezcruz
328
39k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
18
1.1k
Music & Morning Musume
bryan
46
6.7k
Large-scale JavaScript Application Architecture
addyosmani
512
110k
The Power of CSS Pseudo Elements
geoffreycrofte
77
5.9k
The World Runs on Bad Software
bkeepers
PRO
70
11k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
333
22k
Dealing with People You Can't Stand - Big Design 2015
cassininazir
367
26k
Writing Fast Ruby
sferik
628
62k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.6k
Scaling GitHub
holman
462
140k
Why You Should Never Use an ORM
jnunemaker
PRO
59
9.5k
Transcript
ZUNDAMON - X 初見ですがよろしくお願いします 中川航輝 由良太希斗 村上浩輔 平野碧生
01 ZUNDAMON-Xとは? 04 デモ 02 前回まで 03 アップデート 05 技術構成
06 技術挑戦 07 今後 本日の流れ
01 ZUNDAMON-Xとは? 海外の動画で勉強したい! ↓ でも... 英語は聞き取れない! 日本語字幕はすぐ見逃してしまう...
01 ZUNDAMON-Xとは? 可愛いキャラの声 で を 海外の動画 日本語 で聞けるサービス!! ぼ、僕がずんだもんなのだ... YouTubeを吹き替え!?
02 前回実装した機能 早送り、巻き戻ししてもちゃんと音声が聞ける! 125ヶ国もの言語の動画に対応! 字幕をリアルタイムで表示! Vtuberのように画面端にキャラがいる親近感! 1 1 2 2
3 3 4 4
YouTube公式から 翻訳 吹き替え機能が... ?! ?! 敵↓
1 1 18体のキャラクター と 喋り方のスタイル を追加! 2 2 感情分析 により、キャラの表情が変化!(5パターン)
3 3 より可愛く!よいユーザー体験を!UI/UXの改良 03 アップデート情報!
実践してみせるのだ!> 04 デモンストレーション
None
05 技術構成
05 技術構成
06 技術挑戦 1 を動画に間に合わせる 音声の生成 2 という環境 Chrome拡張 YouTubeとのデータのやり取り設計が難しい!! フロント・バックで音声生成の最適化
Reactと要領がぜんぜん違う! Chrome拡張での制約に大苦戦
状態管理 感情分析 同じ音声を生成しないよう、ローカルストレージで管理 音声生成のロジック 字幕の時間に合わせて 喋る速度を自動調整 喋る速度のロジック 状態管理の粒度に合わせて、 Recoil や
Chrome.Storage API を採用 Natural Langage API を使用し、 ポジティブ・ネガティブの感情を分析 06 技術挑戦
今年中のリリース を目標に!! DeepL APIなどにより、 高精度な翻訳 を実現 翻訳精度UP 字幕の適切な区切り 文脈から感情を分析 ChatGPT
の導入 声の生成を 並列化 し、 リリースする! リリースする! 07 今後の展望
終 開発・発表 ━━━━━ Ⓝ Ⓨ Ⓜ Ⓗ ご清聴ありがとう なのだ!!! 初見ですがよろしくお願いします