Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
コンピュータによる音の表現
Search
Naoki Kato
PRO
July 17, 2019
Education
2
490
コンピュータによる音の表現
2025年度更新
Naoki Kato
PRO
July 17, 2019
Tweet
Share
More Decks by Naoki Kato
See All by Naoki Kato
デジタル教科書の現在地と今後の展望
naokikato
PRO
0
39
複数カメラ活用による授業の遠隔参観や収録コンテンツ開発の促進
naokikato
PRO
0
22
教育DXの推進に向けて
naokikato
PRO
0
16
個別最適な学びと協働的な学びから児童の学びを深めさせるICT機器の活用
naokikato
PRO
1
32
なぜDXが必要なのか 〜教育の情報化の現状と展望〜
naokikato
PRO
0
34
教科書の捉えの変化
naokikato
PRO
0
35
教育現場における生成AIの活用とこれからの学校
naokikato
PRO
0
110
学校や家庭における効果的なICTの活用
naokikato
PRO
0
87
学校や家庭における効果的なICTの活用
naokikato
PRO
0
26
Other Decks in Education
See All in Education
2025年度春学期 統計学 第2回 統計資料の収集と読み方(講義前配付用) (2025. 4. 17)
akiraasano
PRO
0
140
検索/ディスプレイ/SNS
takenawa
0
3.1k
演習問題
takenawa
0
3.1k
Tutorial: Foundations of Blind Source Separation and Its Advances in Spatial Self-Supervised Learning
yoshipon
1
110
Data Presentation - Lecture 5 - Information Visualisation (4019538FNR)
signer
PRO
0
2.5k
ThingLink
matleenalaakso
28
4.1k
Education-JAWS #3 ~教育現場に、AWSのチカラを~
masakiokuda
0
160
Implicit and Cross-Device Interaction - Lecture 10 - Next Generation User Interfaces (4018166FNR)
signer
PRO
2
1.7k
第1回大学院理工学系説明会|東京科学大学(Science Tokyo)
sciencetokyo
PRO
0
3.7k
Sponsor the Conference | VizChitra 2025
vizchitra
0
450
Constructing a Custom TeX Ecosystem for Educational Institutions—Beyond Academic Typesetting
doratex
1
7.4k
Pythonパッケージ管理 [uv] 完全入門
mickey_kubo
19
13k
Featured
See All Featured
Agile that works and the tools we love
rasmusluckow
329
21k
Keith and Marios Guide to Fast Websites
keithpitt
411
22k
Navigating Team Friction
lara
186
15k
Rails Girls Zürich Keynote
gr2m
94
14k
jQuery: Nuts, Bolts and Bling
dougneiner
63
7.8k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.3k
The Pragmatic Product Professional
lauravandoore
35
6.7k
Typedesign – Prime Four
hannesfritz
42
2.7k
What's in a price? How to price your products and services
michaelherold
245
12k
CoffeeScript is Beautiful & I Never Want to Write Plain JavaScript Again
sstephenson
161
15k
Sharpening the Axe: The Primacy of Toolmaking
bcantrill
43
2.4k
Designing Experiences People Love
moore
142
24k
Transcript
by Naoki Kato ©Naoki Kato ©Naoki Kato 音の表現 Computer Science,
Engineering and Literacy
by Naoki Kato © Naoki Kato © Naoki Kato コンピュータにおける情報の表現
情報をビット列で表現すると コンピュータに入力(記憶)することができる なんらかの処理をすることができる はじめに ⽂字や絵図 映像 ⾳楽
by Naoki Kato © Naoki Kato © Naoki Kato 標本化
一定の間隔を置いてデータを取り出す 3時間おきに取り出す アナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324
by Naoki Kato © Naoki Kato © Naoki Kato 量子化
離散的な値に近似 2.5度置きの値に近似 標本化は時空間の量子化 アナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324
by Naoki Kato © Naoki Kato © Naoki Kato 符号化
離散的な値にコード(ビット列)を割当 22.5度を000,35度を111 アナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 000 010 100 110 101 011 001 111 011 011 101 110 110 101 011 011・・・
by Naoki Kato © Naoki Kato © Naoki Kato 音は
音の基本
by Naoki Kato © Naoki Kato © Naoki Kato 音は空気の振動波
音の基本 波長:0.01秒 = 周波数:100Hz 時間
by Naoki Kato © Naoki Kato © Naoki Kato 音を感じる聴覚とは
音の基本 空気の振動 ⿎膜 ((((((((((((((((((((((((((((((( 蝸⽜ リンパ液が振動 基底膜 周波数によって 振動する場所が変わる 有⽑細胞から内⽿神経へ
by Naoki Kato © Naoki Kato © Naoki Kato 音は空気の振動波
周波数の違いを音の高低の違いとして認識する 音の基本 波長:0.01秒 ド レ 時間 = 周波数:100Hz
by Naoki Kato © Naoki Kato © Naoki Kato オクターブ
周波数が倍になると,1オクターブ上 音の基本
by Naoki Kato © Naoki Kato © Naoki Kato 実際の音(音色)
基本の周波数に加え,倍の周波数,三倍の周波数, などの音がまざったもの 音の基本
by Naoki Kato © Naoki Kato © Naoki Kato 実際の音(音色)
音の強弱(ビブラート)も音色として感じる 音の基本 + ポーン
by Naoki Kato © Naoki Kato © Naoki Kato 音のサンプリング(標本化)
一定周期(標本化周期)ごとの波の強さを記録 サンプリングレート =1/標本化周期 =標本化周波数 音のディジタル表現
by Naoki Kato © Naoki Kato © Naoki Kato 音の強さの量子化と符号化
波(音)の強さを段階的表現(量子化)し, 新しい値(コード)を与える(符号化) 音のディジタル表現 強さ 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
元の周期の1/12周期で取ると その点を通る正弦波に戻せる サンプリング定理 ただし より短波長(高周波)の正弦波は いくらでも考えられるので無視
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
サンプリング点を通る正弦波を作るが, 波長の短い高周波の正弦波はいくらでも作れるので もっとも長波長(低周波)を選択する サンプリング定理 v 0 標 本 化 周 波 数 より大きい成分 は捨てる
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
では1周期に何回とれば再現可能だろうか 6回?5回?4回?3回?2回?1回? サンプリング定理
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
サンプリング定理 3回 2回 2回未満 2回未満
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
1周期に2回以下だとどうなる? サンプリング定理 v 0 標 本 化 周 波 数 折 り 返 し 成 分 元の周波数 よりも 長波長(短周波)の 正弦波が作れて しまう
by Naoki Kato © Naoki Kato © Naoki Kato サンプリング定理とは
最高周波数 f’’ の 2 倍より大きな周波数で (2回より多く)サンプリング すべての周波数の正弦波が忠実に再現 元の波も忠実に再現 サンプリング定理 周波数 f 周波数 f’ 周波数 f’’
by Naoki Kato © Naoki Kato © Naoki Kato エイリアシング
2×f’’ 以下でサンプリングすると サンプリング定理 f f’ f’’ v 0 標 本 化 周 波 数 元にはない低い⾳が⼊り込む
by Naoki Kato © Naoki Kato © Naoki Kato アンチエイリアシング
周期gでサンプリングするときは g/2 以上をカット サンプリング定理 f f’ f’’ v 0 標 本 化 周 波 数 元にはない低い⾳が⼊らないように ただし⾼い⾳は消える
by Naoki Kato © Naoki Kato © Naoki Kato サンプリングしたデータのサイズ
サンプリング周波数:44.1kHz 量子化ビット:16bit チャンネル数:2チャンネル(ステレオ) 1秒間につき 44100×16×2 ≒1,411,200bit ビットレート:1411kbps 5分の曲だと 1,411,200×5×60 = 423,360,000bit ≒ 53,000,000byte = 53MByte ≒ CD には14曲くらい マルチメディアデータのサイズ
by Naoki Kato © Naoki Kato © Naoki Kato データ圧縮
マルチメディアデータのデータ量は膨大 データ圧縮が重要となる 可逆圧縮 完全に元に戻せるが,圧縮率は低い あらゆる種類のデータに適用 非可逆圧縮 元に戻すことはできないが,圧縮率が高い データの種類ごとに異なる手法 マルチメディアデータでは, 非可逆圧縮 可逆圧縮の順に行うことが多い マルチメディアデータのサイズ
by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮
ランレングス符号 繰り返しの無駄をはぶく LZW圧縮 辞書を用いた圧縮法 パタン(単語)に対して符号を与える マルチメディアデータのサイズ AAABBCCCCCAC A3B2C5A1C1
by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮
ハフマン符号 出現確率に基づいて最適な符号を与える 5文字表現するには 3bit 必要なので 3×21 = 63bit 必要 ※個数の多いほうに1,少ない方に0 4bit×1+4bit×3+3bit×4+2bit×5+1bit×8 = 46bit マルチメディアデータのサイズ AAAAABBCABDDDEEAABDDE 個数 字 1 C 3 E 4 B 5 D 8 A 4 13 8 0 1 0 0 1 1 1 0 C 0011 E 1011 B 111 D 01 A 0
by Naoki Kato © Naoki Kato © Naoki Kato 音データにおける独特な非可逆圧縮技術
過少可聴限界 聞こえない音を無視 マスキング レベルの高い周波数の周りの周波数を無視 レベルの高い音の前後を無視 などなど マルチメディアデータのサイズ
by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象(静的スペクトルマスキング)
聞こえる音の大きさ マルチメディアデータのサイズ 強度⽐ 106倍 1012倍 0 60 120 強度(dB) 1018倍 180 0 20 100 1k 10k 可聴限界 可聴閾 ささやき 会話 叫び声 雷鳴 痛覚閾
by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象(動的スペクトルマスキング)
周波数が近い音がはいってくると 低音の振動が高音の振動にかぶる 高音が聞こえない マルチメディアデータのサイズ ⾼い⾳で振動 低い⾳で振動 蝸⽜の⼊り⼝側 10kHzだとこのように振動 100Hzだとこのように振動 基底膜 強さ
by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象(テンポラルマスキング)
大きな音が入ってくると 音が消えてもしばらく振動(細胞も活性化したまま) 小さめの音が入ってきてもうまく聞こえない マルチメディアデータのサイズ 強さ 次の⾳ ) ) ))) ) ) ) ))) )
by Naoki Kato © Naoki Kato © Naoki Kato ファイル形式とコーデック
コーデック 音データの符号化・複合化方式 ファイル形式(コンテナ) 符号化した音データを格納するファイルの形式 音のデータファイル コンテナ コーデック(圧縮形式) WAV PCM(⾮圧縮), ADPCM, WMA, MP3, など AIFF 標準AIFF(⾮圧縮) MPEG MPEG Audio Layer Ⅰ,Ⅱ,Ⅲ MP4 AAC, MP3, Apple Lossless MP3 MP3
by Naoki Kato © Naoki Kato © Naoki Kato 標準的ファイルフォーマット
WAV:Windows Vista まで標準の音声記録用 WAVコンテナに非圧縮のLPCMデータを格納 WMA ASFコンテナにWMAコーデックを格納 AIFF:Mac標準の音声記録用 AIFFコンテナに非圧縮のLPCMデータを格納 音のデータファイル
by Naoki Kato © Naoki Kato © Naoki Kato よく使われるファイルフォーマット
MP3:MPEG Audio Layer-3 WAVコンテナにMP3コーデックのデータを格納 ビットレート128kbpsでは15kHzあたり以上をカット ビットレート192kbpsでは21kHzあたり以上をカット CDのビットレートの 1/10 MP3コーデックのデータを格納できるコンテナ AVI,MOV,MP4,MPEG-2システム,Ogg,ASF 音のデータファイル
by Naoki Kato © Naoki Kato © Naoki Kato よく使われるファイルフォーマット
MP4:MPEG 4-AAC MP4コンテナにAACコーデックのデータを格納 MP3より高圧縮率・高音質を目標 ビットレート128kbpsでは18kHzあたり以上をカット RealAudio 様々なコーデックを組合せて格納 ストリーミングに対応 音のデータファイル
by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮を用いたファイルフォーマット
Apple Lossless コーデック m4a:MP4コンテナに格納 mov:MOVコンテナに格納(QuickTime) FLACコーデック fla:FLACコンテナに格納 ogg:Oggコンテナに格納 音のデータファイル
by Naoki Kato © Naoki Kato © Naoki Kato 演
演習 習 音の表現
by Naoki Kato © Naoki Kato © Naoki Kato 123appsのオーディオコンバータで
WAVファイルを M4A(高品質,最高品質) MP3(標準,エコノミー) に変換して, ファイルサイズと音質を比較しよう 演習
by Naoki Kato © Naoki Kato © Naoki Kato お
おし しま まい い 音の表現