Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
メディア業界の AI活用
Search
NAXA, Inc.
June 21, 2024
Technology
0
250
メディア業界の AI活用
Media-JAWS 【第15回】
https://media-jaws.connpass.com/event/316706/
NAXA, Inc.
June 21, 2024
Tweet
Share
More Decks by NAXA, Inc.
See All by NAXA, Inc.
Interop Tokyo 2024 テレビ業界を解き放つAI×放送DXの未来
naxa
1
230
Other Decks in Technology
See All in Technology
Oracle Cloud Infrastructure:2025年9月度サービス・アップデート
oracle4engineer
PRO
0
360
about #74462 go/token#FileSet
tomtwinkle
1
270
フルカイテン株式会社 エンジニア向け採用資料
fullkaiten
0
9k
多野優介
tanoyusuke
1
170
定期的な価値提供だけじゃない、スクラムが導くチームの共創化 / 20251004 Naoki Takahashi
shift_evolve
PRO
3
220
PythonとLLMで挑む、 4コマ漫画の構造化データ化
esuji5
1
120
Windows で省エネ
murachiakira
0
150
VCC 2025 Write-up
bata_24
0
150
ZOZOのAI活用実践〜社内基盤からサービス応用まで〜
zozotech
PRO
0
140
KMP の Swift export
kokihirokawa
0
310
【新卒研修資料】LLM・生成AI研修 / Large Language Model・Generative AI
brainpadpr
23
16k
いま注目しているデータエンジニアリングの論点
ikkimiyazaki
0
570
Featured
See All Featured
The Language of Interfaces
destraynor
162
25k
Unsuck your backbone
ammeep
671
58k
Rails Girls Zürich Keynote
gr2m
95
14k
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
30
2.9k
Code Review Best Practice
trishagee
72
19k
[RailsConf 2023] Rails as a piece of cake
palkan
57
5.9k
How GitHub (no longer) Works
holman
315
140k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
140
34k
Build The Right Thing And Hit Your Dates
maggiecrowley
37
2.9k
Building Adaptive Systems
keathley
43
2.8k
The Pragmatic Product Professional
lauravandoore
36
6.9k
KATA
mclloyd
32
14k
Transcript
メディア業界の AI活用 NAXA株式会社 山上駿也
自己紹介 2 山上駿也 NAXA株式会社 AIエンジニア 学生時代はAIエンジニアとしてフリーランス活動 CVPR/BMVC/MIRUに画像認識AIの論文投稿 画像処理/音声処理/自然言語処理 アプリ開発
NAXA株式会社 3 ▪ NAXA株式会社 ビジョン メディア、エンタメの未来を創る 放送局向けソフトウェア開発 クライドプレイアウト、インカムアプリ、音効処理 等 AI技術を活用した新事業
自動字幕生成AI、音源分離AI、デジタルプレイスメント 取り組み 放送技術×AI
本日のテーマ 4 メディア業界における AI活用
Copyright NAXA, Inc. All rights reserved. Index 5 1. 字幕生成AI
2. メタデータ生成AI 3. 音源分離AI 4. AWS Summit 展示紹介
字幕生成AI 6 ▪独自の音声認識エンジン 日本語特化で高精度 ▪編集エディタの提供 モダンで直感的な操作 ▪テレビ局の規約に対応 ARIB字幕 テロップ避け 話者認識
etc.. 放送技術×AI
字幕生成AI 7 字幕制作業務の 90%以上効率化を目指す
メタデータ生成AI 8 膨大な番組データ 検索が非常に大変 → NAXAの音声認識エンジンを用いてメタデータを自動生成 要約、セクション分割、キーワード抽出 等 番組 DB
NAXA 音声認識 エンジン 検索 要約 セクション分割 キーワード抽出
音源分離 9 Voice SE Music ▪楽曲の権利処理 ▪マイク収録時の雑音 →音源分離AIによりセリフと効果音を残しながらBGMの除去を行う. Cross Attention
音源分離AI Waveform Spectrogram
AWS Summit 展示紹介 11 カメラでユーザの状態を観測し、店舗試着からECサイトへの誘導、おすすめ 商品の提案等を行うバーチャルコンシェルジュ。 WebRTCで低遅延接続を確立し、動画/音声/生成AIをリアルタイムで動かす。
NAXA株式会社 東京都文京区本郷3丁目39-9 山本ビル 2階 https://www.naxa.co.jp/