$30 off During Our Annual Pro Sale. View Details »
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
サポーターズ 技育CAMPアドバンスVol.3
Search
Minimalist30
September 02, 2023
0
72
サポーターズ 技育CAMPアドバンスVol.3
2023年9月
サポーターズ主催の技育CAMPアドバンス Vol.3で発表した時に使用したスライド
発表時間:3分
Minimalist30
September 02, 2023
Tweet
Share
More Decks by Minimalist30
See All by Minimalist30
とやまローカルメディアハッカソン 2024
minimalist30
1
160
逆求人形式イベント 自己紹介
minimalist30
0
57
株式会社CARTA HOLDINGS インターンシップ
minimalist30
0
50
授業_IoTプログラミング_発表資料
minimalist30
0
4
サポーターズ 技育CAMPキャラバン@金沢
minimalist30
0
65
サポーターズ LT会
minimalist30
0
31
Featured
See All Featured
Jamie Indigo - Trashchat’s Guide to Black Boxes: Technical SEO Tactics for LLMs
techseoconnect
PRO
0
32
Designing for Performance
lara
610
69k
Prompt Engineering for Job Search
mfonobong
0
130
YesSQL, Process and Tooling at Scale
rocio
174
15k
Conquering PDFs: document understanding beyond plain text
inesmontani
PRO
4
2.1k
Public Speaking Without Barfing On Your Shoes - THAT 2023
reverentgeek
1
280
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
170
How to audit for AI Accessibility on your Front & Back End
davetheseo
0
120
[RailsConf 2023 Opening Keynote] The Magic of Rails
eileencodes
31
9.8k
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
2
2.8k
Embracing the Ebb and Flow
colly
88
4.9k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
170
Transcript
ZUNDAMON - X 初見ですがよろしくお願いします 中川航輝 由良太希斗 村上浩輔 平野碧生
01 ZUNDAMON-Xとは? 04 デモ 02 前回まで 03 アップデート 05 技術構成
06 技術挑戦 07 今後 本日の流れ
01 ZUNDAMON-Xとは? 海外の動画で勉強したい! ↓ でも... 英語は聞き取れない! 日本語字幕はすぐ見逃してしまう...
01 ZUNDAMON-Xとは? 可愛いキャラの声 で を 海外の動画 日本語 で聞けるサービス!! ぼ、僕がずんだもんなのだ... YouTubeを吹き替え!?
02 前回実装した機能 早送り、巻き戻ししてもちゃんと音声が聞ける! 125ヶ国もの言語の動画に対応! 字幕をリアルタイムで表示! Vtuberのように画面端にキャラがいる親近感! 1 1 2 2
3 3 4 4
YouTube公式から 翻訳 吹き替え機能が... ?! ?! 敵↓
1 1 18体のキャラクター と 喋り方のスタイル を追加! 2 2 感情分析 により、キャラの表情が変化!(5パターン)
3 3 より可愛く!よいユーザー体験を!UI/UXの改良 03 アップデート情報!
実践してみせるのだ!> 04 デモンストレーション
None
05 技術構成
05 技術構成
06 技術挑戦 1 を動画に間に合わせる 音声の生成 2 という環境 Chrome拡張 YouTubeとのデータのやり取り設計が難しい!! フロント・バックで音声生成の最適化
Reactと要領がぜんぜん違う! Chrome拡張での制約に大苦戦
状態管理 感情分析 同じ音声を生成しないよう、ローカルストレージで管理 音声生成のロジック 字幕の時間に合わせて 喋る速度を自動調整 喋る速度のロジック 状態管理の粒度に合わせて、 Recoil や
Chrome.Storage API を採用 Natural Langage API を使用し、 ポジティブ・ネガティブの感情を分析 06 技術挑戦
今年中のリリース を目標に!! DeepL APIなどにより、 高精度な翻訳 を実現 翻訳精度UP 字幕の適切な区切り 文脈から感情を分析 ChatGPT
の導入 声の生成を 並列化 し、 リリースする! リリースする! 07 今後の展望
終 開発・発表 ━━━━━ Ⓝ Ⓨ Ⓜ Ⓗ ご清聴ありがとう なのだ!!! 初見ですがよろしくお願いします