Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
32bitフロート録音で 音割れしない理由 2022/11/11 千田 航己
Slide 2
Slide 2 text
©2022 Voicy, Inc. はじめに ● 32bitフロートとは ○ 量子化 (Quantization) の方法 ○ 音声データを32bit浮動小数点表現で保存する ● なぜ音割れしづらいのか ○ 音割れの原因はマイクの ゲインの上げすぎ ○ 32bitフロートはゲインを小さくしても十分な分解能があるため 32bitフロート録音は音割れしづらいらしい → 一般の方にこれを正しく説明するのはむずかしい... エンジニアはデータ型の知識があるので説明が簡単!
Slide 3
Slide 3 text
©2022 Voicy, Inc. なぜこの話をするのか https://zoomcorp.com/ja/jp/field-recorders/field-recorders/f3/ ZOOM『F3』がすごいと話題に
Slide 4
Slide 4 text
©2022 Voicy, Inc. なぜこの話をするのか ● ネット上には微妙な解説記事や動画が溢れかえっていました ○ かなしい 音割れしない正しい解説が見つからない
Slide 5
Slide 5 text
©2022 Voicy, Inc. 前回のおさらい ● 音をデジタル化する 標本化と量子化
Slide 6
Slide 6 text
©2022 Voicy, Inc. 前回のおさらい ● 信号を時間方向に離散化する 標本化
Slide 7
Slide 7 text
©2022 Voicy, Inc. 前回のおさらい ● 得られた信号を振幅方向に離散化する 量子化
Slide 8
Slide 8 text
©2022 Voicy, Inc. そもそもなんで音割れするのか 音量の上限を超えたとき Max min
Slide 9
Slide 9 text
©2022 Voicy, Inc. そもそもなんで音割れするのか 音量の上限を超えたとき Max min
Slide 10
Slide 10 text
©2022 Voicy, Inc. そもそもなんで音割れするのか 音量の上限を超えたとき Max min
Slide 11
Slide 11 text
©2022 Voicy, Inc. じゃあゲインを下げればいいじゃん? ゲインを下げすぎると量子化誤差が大きくなる
Slide 12
Slide 12 text
©2022 Voicy, Inc. じゃあゲインを下げればいいじゃん? ゲインを下げすぎると量子化誤差が大きくなる
Slide 13
Slide 13 text
©2022 Voicy, Inc. じゃあゲインを下げればいいじゃん? ゲインを下げすぎると量子化誤差が大きくなる
Slide 14
Slide 14 text
©2022 Voicy, Inc. じゃあゲインを下げればいいじゃん? ● ゲインを下げすぎると量子化誤差が大きくなる ゲイン高め ゲイン低め 11段階で表現できる (-5 〜 5) 5段階で表現することになる (-2 〜2)
Slide 15
Slide 15 text
©2022 Voicy, Inc. ● 音割れしやすい例 ○ 2人で話していて、片方の人だけ声が大きい ○ 普通に話すときは声が小さいが、笑うときだけ声が大きい → 音量の差がある ● 適切なゲイン ○ できるだけ大きく ○ でも音割れしない範囲で 適切なゲイン ゲイン設定は難しい
Slide 16
Slide 16 text
©2022 Voicy, Inc. 量子化の方法 32bitフロート録音 ● 32bitフロート ○ 振幅の値を32bit浮動小数点表現で保存する ← 一般向けにはこれだと説明不足なので難しい ● 参考 ○ CD音源 ■ サンプリング周波数: 44.1 kHz ■ 量子化方法: 16 bit リニアPCM (← 16bitのint)
Slide 17
Slide 17 text
©2022 Voicy, Inc. 量子化が細かいのでゲインを下げても大丈夫! 32bitフロート録音のメリット ● 16bit ○ 2^16 = 65,536 段階の情報量 ● 32 bit ○ 2 ^ 32 = 4,294,967,296 段階の情報量
Slide 18
Slide 18 text
©2022 Voicy, Inc. ダイナミックレンジが広いので音量の差が大きくても大丈夫! 32bitフロート録音のメリット ● 16bit integer ○ min: -32768 〜 Max: 32767 ● 32 bit float ○ min: -3.40282e+38 〜 Max: 3.40282e+38 ○ (絶対値: 1.17549e-38 〜 3.40282e+38)
Slide 19
Slide 19 text
©2022 Voicy, Inc. 32bitフロート録音のメリット ● Integerは最小値から最大値を均等に刻む ○ ゲインを下げると表現力 (= 実質的bit数) がリニアに落ちる ● 浮動小数点は0付近を細かく表現できる ○ ゲインを下げても表現力が減りづらい 浮動小数点は0付近の解像度が高い
Slide 20
Slide 20 text
©2022 Voicy, Inc. むすび ● 32bitフロートとは ○ 量子化 (Quantization) の方法 ○ 音声データを32bit浮動小数点表現で保存する ● なぜ音割れしづらいのか ○ 音割れの原因はマイクの ゲインの上げすぎ ○ 32bitフロートはゲインを小さくしても十分な分解能があるため 32bitフロート録音は音割れしづらいらしい
Slide 21
Slide 21 text
音声×テクノロジーでワクワクする社会をつくる