コンピュータによる音の表現

by Naoki Kato ©Naoki Kato ©Naoki Kato 音の表現 Computer Science,
Engineering and Literacy

by Naoki Kato © Naoki Kato © Naoki Kato コンピュータにおける情報の表現
情報をビット列で表現するとコンピュータに入力（記憶）することができるなんらかの処理をすることができるはじめに⽂字や絵図映像⾳楽

by Naoki Kato © Naoki Kato © Naoki Kato 標本化
一定の間隔を置いてデータを取り出す 3時間おきに取り出すアナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324

by Naoki Kato © Naoki Kato © Naoki Kato 量子化
離散的な値に近似 2.5度置きの値に近似標本化は時空間の量子化アナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324

by Naoki Kato © Naoki Kato © Naoki Kato 符号化
離散的な値にコード（ビット列）を割当 22.5度を000，35度を111 アナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 000 010 100 110 101 011 001 111 011 011 101 110 110 101 011 011・・・

by Naoki Kato © Naoki Kato © Naoki Kato 音は
音の基本

by Naoki Kato © Naoki Kato © Naoki Kato 音は空気の振動波
音の基本波長：0.01秒＝周波数：100Hz 時間

by Naoki Kato © Naoki Kato © Naoki Kato 音を感じる聴覚とは
音の基本空気の振動⿎膜 ((((((((((((((((((((((((((((((( 蝸⽜リンパ液が振動基底膜周波数によって振動する場所が変わる有⽑細胞から内⽿神経へ

by Naoki Kato © Naoki Kato © Naoki Kato 音は空気の振動波
周波数の違いを音の高低の違いとして認識する音の基本波長：0.01秒ドレ時間＝周波数：100Hz

by Naoki Kato © Naoki Kato © Naoki Kato オクターブ
周波数が倍になると，1オクターブ上音の基本

by Naoki Kato © Naoki Kato © Naoki Kato 実際の音（音色）
基本の周波数に加え，倍の周波数，三倍の周波数，などの音がまざったもの音の基本

by Naoki Kato © Naoki Kato © Naoki Kato 実際の音（音色）
音の強弱（ビブラート）も音色として感じる音の基本＋ポーン

by Naoki Kato © Naoki Kato © Naoki Kato 音のサンプリング（標本化）
一定周期（標本化周期）ごとの波の強さを記録サンプリングレート＝１／標本化周期＝標本化周波数音のディジタル表現

by Naoki Kato © Naoki Kato © Naoki Kato 音の強さの量子化と符号化
波（音）の強さを段階的表現（量子化）し，新しい値（コード）を与える（符号化）音のディジタル表現強さ 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001

by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには？
元の周期の1/12周期で取るとその点を通る正弦波に戻せるサンプリング定理ただしより短波長（高周波）の正弦波はいくらでも考えられるので無視

サンプリング点を通る正弦波を作るが，波長の短い高周波の正弦波はいくらでも作れるのでもっとも長波長（低周波）を選択するサンプリング定理 v 0 標本化周波数より大きい成分は捨てる

では1周期に何回とれば再現可能だろうか 6回？5回？4回？3回？2回？1回？サンプリング定理

サンプリング定理 3回 2回 2回未満 2回未満

1周期に2回以下だとどうなる？サンプリング定理 v 0 標本化周波数折り返し成分元の周波数よりも長波長（短周波）の正弦波が作れてしまう

by Naoki Kato © Naoki Kato © Naoki Kato サンプリング定理とは
最高周波数 f’’ の 2 倍より大きな周波数で（2回より多く）サンプリングすべての周波数の正弦波が忠実に再現元の波も忠実に再現サンプリング定理周波数 f 周波数 f’ 周波数 f’’

by Naoki Kato © Naoki Kato © Naoki Kato エイリアシング
2×f’’ 以下でサンプリングするとサンプリング定理 f f’ f’’ v 0 標本化周波数元にはない低い⾳が⼊り込む

by Naoki Kato © Naoki Kato © Naoki Kato アンチエイリアシング
周期gでサンプリングするときは g/2 以上をカットサンプリング定理 f f’ f’’ v 0 標本化周波数元にはない低い⾳が⼊らないようにただし⾼い⾳は消える

by Naoki Kato © Naoki Kato © Naoki Kato サンプリングしたデータのサイズ
サンプリング周波数：44.1kHz 量子化ビット：16bit チャンネル数：2チャンネル（ステレオ） 1秒間につき 44100×16×2 ≒1,411,200bit ビットレート：1411kbps 5分の曲だと 1,411,200×5×60 = 423,360,000bit ≒ 53,000,000byte = 53MByte ≒ CD には14曲くらいマルチメディアデータのサイズ

by Naoki Kato © Naoki Kato © Naoki Kato データ圧縮
マルチメディアデータのデータ量は膨大データ圧縮が重要となる可逆圧縮完全に元に戻せるが，圧縮率は低いあらゆる種類のデータに適用非可逆圧縮元に戻すことはできないが，圧縮率が高いデータの種類ごとに異なる手法マルチメディアデータでは，非可逆圧縮可逆圧縮の順に行うことが多いマルチメディアデータのサイズ

by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮
ランレングス符号繰り返しの無駄をはぶく LZW圧縮辞書を用いた圧縮法パタン（単語）に対して符号を与えるマルチメディアデータのサイズ AAABBCCCCCAC A3B2C5A1C1

by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮
ハフマン符号出現確率に基づいて最適な符号を与える 5文字表現するには 3bit 必要なので 3×21 = 63bit 必要 ※個数の多いほうに1，少ない方に0 4bit×1+4bit×3+3bit×4+2bit×5+1bit×8 = 46bit マルチメディアデータのサイズ AAAAABBCABDDDEEAABDDE 個数字 1 C 3 E 4 B 5 D 8 A 4 13 8 0 1 0 0 1 1 1 0 C 0011 E 1011 B 111 D 01 A 0

by Naoki Kato © Naoki Kato © Naoki Kato 音データにおける独特な非可逆圧縮技術
過少可聴限界聞こえない音を無視マスキングレベルの高い周波数の周りの周波数を無視レベルの高い音の前後を無視などなどマルチメディアデータのサイズ

by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象（静的スペクトルマスキング）
聞こえる音の大きさマルチメディアデータのサイズ強度⽐ 106倍 1012倍 0 60 120 強度(dB) 1018倍 180 0 20 100 1k 10k 可聴限界可聴閾ささやき会話叫び声雷鳴痛覚閾

by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象（動的スペクトルマスキング）
周波数が近い音がはいってくると低音の振動が高音の振動にかぶる高音が聞こえないマルチメディアデータのサイズ⾼い⾳で振動低い⾳で振動蝸⽜の⼊り⼝側 10kHzだとこのように振動 100Hzだとこのように振動基底膜強さ

by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象（テンポラルマスキング）
大きな音が入ってくると音が消えてもしばらく振動（細胞も活性化したまま）小さめの音が入ってきてもうまく聞こえないマルチメディアデータのサイズ強さ次の⾳ ) ) ))) ) ) ) ))) )

by Naoki Kato © Naoki Kato © Naoki Kato ファイル形式とコーデック
コーデック音データの符号化・複合化方式ファイル形式（コンテナ）符号化した音データを格納するファイルの形式音のデータファイルコンテナコーデック（圧縮形式） WAV PCM（⾮圧縮）, ADPCM, WMA, MP3, など AIFF 標準AIFF（⾮圧縮） MPEG MPEG Audio Layer Ⅰ,Ⅱ,Ⅲ MP4 AAC, MP3, Apple Lossless MP3 MP3

by Naoki Kato © Naoki Kato © Naoki Kato 標準的ファイルフォーマット
WAV：Windows Vista まで標準の音声記録用 WAVコンテナに非圧縮のLPCMデータを格納 WMA ASFコンテナにWMAコーデックを格納 AIFF：Mac標準の音声記録用 AIFFコンテナに非圧縮のLPCMデータを格納音のデータファイル

by Naoki Kato © Naoki Kato © Naoki Kato よく使われるファイルフォーマット
MP3：MPEG Audio Layer-3 WAVコンテナにMP3コーデックのデータを格納ビットレート128kbpsでは15kHzあたり以上をカットビットレート192kbpsでは21kHzあたり以上をカット CDのビットレートの 1/10 MP3コーデックのデータを格納できるコンテナ AVI，MOV，MP4，MPEG-2システム，Ogg，ASF 音のデータファイル

by Naoki Kato © Naoki Kato © Naoki Kato よく使われるファイルフォーマット
MP4：MPEG 4-AAC MP4コンテナにAACコーデックのデータを格納 MP3より高圧縮率・高音質を目標ビットレート128kbpsでは18kHzあたり以上をカット RealAudio 様々なコーデックを組合せて格納ストリーミングに対応音のデータファイル

by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮を用いたファイルフォーマット
Apple Lossless コーデック m4a：MP4コンテナに格納 mov：MOVコンテナに格納（QuickTime） FLACコーデック fla：FLACコンテナに格納 ogg：Oggコンテナに格納音のデータファイル

by Naoki Kato © Naoki Kato © Naoki Kato 演
演習習音の表現

by Naoki Kato © Naoki Kato © Naoki Kato 123appsのオーディオコンバータで
WAVファイルを M4A（高品質，最高品質） MP3（標準，エコノミー）に変換して，ファイルサイズと音質を比較しよう演習

by Naoki Kato © Naoki Kato © Naoki Kato お
おししままいい音の表現

コンピュータによる音の表現

コンピュータによる音の表現

More Decks by Naoki Kato

Other Decks in Education

Featured

Transcript