Slide 1

Slide 1 text

メディア業界の AI活用 NAXA株式会社 山上駿也

Slide 2

Slide 2 text

自己紹介 2 山上駿也 NAXA株式会社 AIエンジニア 学生時代はAIエンジニアとしてフリーランス活動 CVPR/BMVC/MIRUに画像認識AIの論文投稿 画像処理/音声処理/自然言語処理 アプリ開発

Slide 3

Slide 3 text

NAXA株式会社 3 ■ NAXA株式会社 ビジョン メディア、エンタメの未来を創る 放送局向けソフトウェア開発 クライドプレイアウト、インカムアプリ、音効処理 等 AI技術を活用した新事業 自動字幕生成AI、音源分離AI、デジタルプレイスメント 取り組み 放送技術×AI

Slide 4

Slide 4 text

本日のテーマ 4 メディア業界における AI活用

Slide 5

Slide 5 text

Copyright NAXA, Inc. All rights reserved. Index 5 1. 字幕生成AI 2. メタデータ生成AI 3. 音源分離AI 4. AWS Summit 展示紹介

Slide 6

Slide 6 text

字幕生成AI 6 ■独自の音声認識エンジン 日本語特化で高精度 ■編集エディタの提供 モダンで直感的な操作 ■テレビ局の規約に対応 ARIB字幕 テロップ避け 話者認識 etc.. 放送技術×AI

Slide 7

Slide 7 text

字幕生成AI 7 字幕制作業務の 90%以上効率化を目指す

Slide 8

Slide 8 text

メタデータ生成AI 8 膨大な番組データ 検索が非常に大変 → NAXAの音声認識エンジンを用いてメタデータを自動生成 要約、セクション分割、キーワード抽出 等 番組 DB NAXA 音声認識 エンジン 検索 要約 セクション分割 キーワード抽出

Slide 9

Slide 9 text

音源分離 9 Voice SE Music ■楽曲の権利処理 ■マイク収録時の雑音 →音源分離AIによりセリフと効果音を残しながらBGMの除去を行う. Cross Attention 音源分離AI Waveform Spectrogram

Slide 10

Slide 10 text

AWS Summit 展示紹介 11 カメラでユーザの状態を観測し、店舗試着からECサイトへの誘導、おすすめ 商品の提案等を行うバーチャルコンシェルジュ。 WebRTCで低遅延接続を確立し、動画/音声/生成AIをリアルタイムで動かす。

Slide 11

Slide 11 text

NAXA株式会社 東京都文京区本郷3丁目39-9 山本ビル 2階 https://www.naxa.co.jp/