音声合成の発音正確性と自然性

音声合成は元々、入力と出力の対応が一対多になりやすい問題設定だが、そこには入出力の好ましい対応とそうでないものがある。従来は、技術的な問題で好ましくない対応が混入することにより、指定した文字と異なる発音をする場合がごくまれにあった。例えば「が」が「か」になったり、「と」が「た」になったりしていた。こういったことがあると特定の日付だけうまく言えない等の事故が起きうるので、特に予約タスクなどの自動対話では問題となる。音響モデルの性質の違いとアラインメントの観点で、こうした発音違いを抑制する手法について紹介する。

https://cadc.cyberagent.co.jp/2023/sessions/research-audio/?utm_medium=ca_ex&utm_source=speaker_deck&utm_campaign=official

CyberAgent PRO

June 29, 2023

Tweet

More Decks by CyberAgent

See All by CyberAgent

マッチングアプリにおけるユーザー構成の変化は、事業KPIにどう影響しているのか

cyberagentdevelopers

PRO

1

21

Geo-Experiments : ABEMAはなぜ新しい宣伝の効果検証にチャレンジするのか

cyberagentdevelopers

PRO

1

19

ABEMA NEWSにおける PoCをAIプロダクト化するビジネスリードエンジニアリング

cyberagentdevelopers

PRO

0

160

チーム開発の基礎_研究を事業につなげるために

cyberagentdevelopers

PRO

8

4.8k

生成AIの研究活用_AILab2025研修

cyberagentdevelopers

PRO

12

6.9k

生成AIを活用したデータ分析でいまできること

cyberagentdevelopers

PRO

2

430

IBC 2025 動画技術関連レポート / IBC 2025 Report

cyberagentdevelopers

PRO

2

480

2025年度生成AI 実践編

cyberagentdevelopers

PRO

8

1k

LLMを用いたメタデータベースレコメンド検証

cyberagentdevelopers

PRO

6

2.2k

Other Decks in Technology

See All in Technology

銀行の内製開発にて2つのプロダクトを１つのチームでスクラムしてみてる話

1

130

Keycloak を使った SSO で CockroachDB にログインする / CockroachDB SSO with Keycloak

0

140

今のWordPress の制作手法ってなにがあんねん？(改) / What’s the Deal with WordPress Development These Days?

0

490

Abuse report だけじゃない。AWS から緊急連絡が来る状況とは？昨今の攻撃や被害の事例の紹介と備えておきたい考え方について

1

820

OCHaCafe S11 #2 コンテナ時代の次の一手：Wasm 最前線

oracle4engineer

PRO

2

140

PMとしての意思決定とAI活用状況について

PRO

0

130

バクラク最古参プロダクトで重ねた技術投資を振り返る

0

160

Go標準パッケージのI/O処理をながめる

0

220

AI実装による「レビューボトルネック」を解消する仕様駆動開発（SDD）/ ai-sdd-review-bottleneck

0

150

組織全体で実現する標準監視設計

3

490

AWS CDK「読めるけど書けない」を脱却するファーストステップ

3

150

AI時代のSaaSとETL

1

170

Featured

See All Featured

Ruling the World: When Life Gets Gamed

0

180

Art, The Web, and Tiny UX

304

21k

B2B Lead Gen: Tactics, Traps & Triumph

0

77

Building Adaptive Systems

44

3k

SEO Brein meetup: CTRL+C is not how to scale international SEO

1

2.4k

Navigating Team Friction

192

16k

個人開発の失敗を避けるイケてる考え方 / tips for indie hackers

122

21k

Agile that works and the tools we love

331

21k

How to Think Like a Performance Engineer

28

2.5k

The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs

PRO

3

3.1k

Principles of Awesome APIs and How to Build Them.

128

17k

Building Experiences: Design Systems, User Experience, and Full Site Editing

0

440

Transcript