Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サポーターズ 技育CAMPアドバンスVol.3
Search
Minimalist30
September 02, 2023
0
33
サポーターズ 技育CAMPアドバンスVol.3
2023年9月
サポーターズ主催の技育CAMPアドバンス Vol.3で発表した時に使用したスライド
発表時間:3分
Minimalist30
September 02, 2023
Tweet
Share
More Decks by Minimalist30
See All by Minimalist30
とやまローカルメディアハッカソン 2024
minimalist30
1
130
逆求人形式イベント 自己紹介
minimalist30
0
39
株式会社CARTA HOLDINGS インターンシップ
minimalist30
0
32
サポーターズ 技育CAMPキャラバン@金沢
minimalist30
0
33
サポーターズ LT会
minimalist30
0
21
Featured
See All Featured
Exploring the Power of Turbo Streams & Action Cable | RailsConf2023
kevinliebholz
30
4.6k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
10
520
Why Our Code Smells
bkeepers
PRO
336
57k
VelocityConf: Rendering Performance Case Studies
addyosmani
328
24k
A Modern Web Designer's Workflow
chriscoyier
693
190k
Learning to Love Humans: Emotional Interface Design
aarron
273
40k
Embracing the Ebb and Flow
colly
84
4.6k
The Cost Of JavaScript in 2023
addyosmani
47
7.4k
Navigating Team Friction
lara
183
15k
The Myth of the Modular Monolith - Day 2 Keynote - Rails World 2024
eileencodes
21
2.5k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.7k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
251
21k
Transcript
ZUNDAMON - X 初見ですがよろしくお願いします 中川航輝 由良太希斗 村上浩輔 平野碧生
01 ZUNDAMON-Xとは? 04 デモ 02 前回まで 03 アップデート 05 技術構成
06 技術挑戦 07 今後 本日の流れ
01 ZUNDAMON-Xとは? 海外の動画で勉強したい! ↓ でも... 英語は聞き取れない! 日本語字幕はすぐ見逃してしまう...
01 ZUNDAMON-Xとは? 可愛いキャラの声 で を 海外の動画 日本語 で聞けるサービス!! ぼ、僕がずんだもんなのだ... YouTubeを吹き替え!?
02 前回実装した機能 早送り、巻き戻ししてもちゃんと音声が聞ける! 125ヶ国もの言語の動画に対応! 字幕をリアルタイムで表示! Vtuberのように画面端にキャラがいる親近感! 1 1 2 2
3 3 4 4
YouTube公式から 翻訳 吹き替え機能が... ?! ?! 敵↓
1 1 18体のキャラクター と 喋り方のスタイル を追加! 2 2 感情分析 により、キャラの表情が変化!(5パターン)
3 3 より可愛く!よいユーザー体験を!UI/UXの改良 03 アップデート情報!
実践してみせるのだ!> 04 デモンストレーション
None
05 技術構成
05 技術構成
06 技術挑戦 1 を動画に間に合わせる 音声の生成 2 という環境 Chrome拡張 YouTubeとのデータのやり取り設計が難しい!! フロント・バックで音声生成の最適化
Reactと要領がぜんぜん違う! Chrome拡張での制約に大苦戦
状態管理 感情分析 同じ音声を生成しないよう、ローカルストレージで管理 音声生成のロジック 字幕の時間に合わせて 喋る速度を自動調整 喋る速度のロジック 状態管理の粒度に合わせて、 Recoil や
Chrome.Storage API を採用 Natural Langage API を使用し、 ポジティブ・ネガティブの感情を分析 06 技術挑戦
今年中のリリース を目標に!! DeepL APIなどにより、 高精度な翻訳 を実現 翻訳精度UP 字幕の適切な区切り 文脈から感情を分析 ChatGPT
の導入 声の生成を 並列化 し、 リリースする! リリースする! 07 今後の展望
終 開発・発表 ━━━━━ Ⓝ Ⓨ Ⓜ Ⓗ ご清聴ありがとう なのだ!!! 初見ですがよろしくお願いします