Slide 1

Slide 1 text

32bitフロート録音で 
 音割れしない理由 
 2022/11/11 千田 航己 


Slide 2

Slide 2 text

©2022 Voicy, Inc. はじめに
 ● 32bitフロートとは
 ○ 量子化 (Quantization) の方法 
 ○ 音声データを32bit浮動小数点表現で保存する 
 ● なぜ音割れしづらいのか
 ○ 音割れの原因はマイクの ゲインの上げすぎ
 ○ 32bitフロートはゲインを小さくしても十分な分解能があるため 
 32bitフロート録音は音割れしづらいらしい 
 → 一般の方にこれを正しく説明するのはむずかしい... 
 エンジニアはデータ型の知識があるので説明が簡単!

Slide 3

Slide 3 text

©2022 Voicy, Inc. なぜこの話をするのか 
 
 
 
 
 
 
 https://zoomcorp.com/ja/jp/field-recorders/field-recorders/f3/ 
 ZOOM『F3』がすごいと話題に 


Slide 4

Slide 4 text

©2022 Voicy, Inc. なぜこの話をするのか 
 ● ネット上には微妙な解説記事や動画が溢れかえっていました 
 ○ かなしい
 音割れしない正しい解説が見つからない 


Slide 5

Slide 5 text

©2022 Voicy, Inc. 前回のおさらい 
 ● 音をデジタル化する
 標本化と量子化 


Slide 6

Slide 6 text

©2022 Voicy, Inc. 前回のおさらい 
 ● 信号を時間方向に離散化する
 標本化


Slide 7

Slide 7 text

©2022 Voicy, Inc. 前回のおさらい 
 ● 得られた信号を振幅方向に離散化する
 量子化


Slide 8

Slide 8 text

©2022 Voicy, Inc. そもそもなんで音割れするのか 
 音量の上限を超えたとき 
 Max
 min


Slide 9

Slide 9 text

©2022 Voicy, Inc. そもそもなんで音割れするのか 
 音量の上限を超えたとき 
 Max
 min


Slide 10

Slide 10 text

©2022 Voicy, Inc. そもそもなんで音割れするのか 
 音量の上限を超えたとき 
 Max
 min


Slide 11

Slide 11 text

©2022 Voicy, Inc. じゃあゲインを下げればいいじゃん? 
 ゲインを下げすぎると量子化誤差が大きくなる 
 


Slide 12

Slide 12 text

©2022 Voicy, Inc. じゃあゲインを下げればいいじゃん? 
 ゲインを下げすぎると量子化誤差が大きくなる 


Slide 13

Slide 13 text

©2022 Voicy, Inc. じゃあゲインを下げればいいじゃん? 
 ゲインを下げすぎると量子化誤差が大きくなる 


Slide 14

Slide 14 text

©2022 Voicy, Inc. じゃあゲインを下げればいいじゃん? 
 ● 
 ゲインを下げすぎると量子化誤差が大きくなる 
 ゲイン高め
 ゲイン低め
 11段階で表現できる (-5 〜 5)
 5段階で表現することになる (-2 〜2)


Slide 15

Slide 15 text

©2022 Voicy, Inc. ● 音割れしやすい例
 ○ 2人で話していて、片方の人だけ声が大きい 
 ○ 普通に話すときは声が小さいが、笑うときだけ声が大きい 
 → 音量の差がある
 ● 適切なゲイン
 ○ できるだけ大きく
 ○ でも音割れしない範囲で 
 適切なゲイン 
 ゲイン設定は難しい 


Slide 16

Slide 16 text

©2022 Voicy, Inc. 量子化の方法 
 32bitフロート録音 
 ● 32bitフロート
 ○ 振幅の値を32bit浮動小数点表現で保存する ← 一般向けにはこれだと説明不足なので難しい 
 
 
 ● 参考
 ○ CD音源
 ■ サンプリング周波数: 44.1 kHz 
 ■ 量子化方法: 16 bit リニアPCM (← 16bitのint) 


Slide 17

Slide 17 text

©2022 Voicy, Inc. 量子化が細かいのでゲインを下げても大丈夫! 
 32bitフロート録音のメリット 
 ● 16bit
 ○ 2^16 = 65,536 段階の情報量 
 ● 32 bit
 ○ 2 ^ 32 = 4,294,967,296 段階の情報量 


Slide 18

Slide 18 text

©2022 Voicy, Inc. ダイナミックレンジが広いので音量の差が大きくても大丈夫! 
 32bitフロート録音のメリット 
 ● 16bit integer
 ○ min: -32768 〜 Max: 32767 
 ● 32 bit float
 ○ min: -3.40282e+38 〜 Max: 3.40282e+38 
 ○ (絶対値: 1.17549e-38 〜 3.40282e+38) 


Slide 19

Slide 19 text

©2022 Voicy, Inc. 32bitフロート録音のメリット 
 ● Integerは最小値から最大値を均等に刻む
 ○ ゲインを下げると表現力 (= 実質的bit数) がリニアに落ちる 
 ● 浮動小数点は0付近を細かく表現できる
 ○ ゲインを下げても表現力が減りづらい 
 浮動小数点は0付近の解像度が高い 


Slide 20

Slide 20 text

©2022 Voicy, Inc. むすび
 ● 32bitフロートとは
 ○ 量子化 (Quantization) の方法 
 ○ 音声データを32bit浮動小数点表現で保存する 
 ● なぜ音割れしづらいのか
 ○ 音割れの原因はマイクの ゲインの上げすぎ
 ○ 32bitフロートはゲインを小さくしても十分な分解能があるため 
 32bitフロート録音は音割れしづらいらしい 


Slide 21

Slide 21 text

音声×テクノロジーでワクワクする社会をつくる