Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
コンピュータによる音の表現
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Naoki Kato
PRO
July 17, 2019
Education
2
500
コンピュータによる音の表現
2025年度更新
Naoki Kato
PRO
July 17, 2019
Tweet
Share
More Decks by Naoki Kato
See All by Naoki Kato
学習者用デジタル教科書の活用
naokikato
PRO
0
36
子どもが自立した学習者となるデジタルの活用について
naokikato
PRO
0
190
高校におけるプログラミング教育を考える
naokikato
PRO
0
200
デジタル教科書研究の今
naokikato
PRO
0
42
デジタル教科書の現在地と今後の展望
naokikato
PRO
0
110
複数カメラ活用による授業の遠隔参観や収録コンテンツ開発の促進
naokikato
PRO
0
100
教育DXの推進に向けて
naokikato
PRO
0
58
個別最適な学びと協働的な学びから児童の学びを深めさせるICT機器の活用
naokikato
PRO
1
61
なぜDXが必要なのか 〜教育の情報化の現状と展望〜
naokikato
PRO
0
61
Other Decks in Education
See All in Education
1216
cbtlibrary
0
150
160人の中高生にAI・技術体験の講師をしてみた話
shuntatoda
1
340
地区危機管理委員会 出前セミナー「ロータリーにおける危機管理」:膳所 和彦 氏(国際ロータリー第2720地区 パストガバナー・日田ロータリークラブ・医療法人恒心会ぜぜ医院 理事長):2720 Japan O.K. ロータリーEクラブ2026年2月16日卓話
2720japanoke
1
570
卒論の書き方 / Happy Writing
kaityo256
PRO
56
28k
The Next Big Step Toward Nuclear Disarmament
hide2kano
0
250
滑空スポーツ講習会2025(実技講習)EMFT講習 実施要領/JSA EMFT 2025 procedure
jsaseminar
0
130
TeXで変える教育現場
doratex
1
16k
Introduction - Lecture 1 - Information Visualisation (4019538FNR)
signer
PRO
0
5.2k
MySmartSTEAM 2526
cbtlibrary
0
200
インシデント対応
akira345
0
190
RGBでも蛍光を!? / RayTracingCamp11
kugimasa
2
430
1202
cbtlibrary
0
220
Featured
See All Featured
Color Theory Basics | Prateek | Gurzu
gurzu
0
220
SEO for Brand Visibility & Recognition
aleyda
0
4.3k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
130
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Paper Plane (Part 1)
katiecoart
PRO
0
5k
The Cult of Friendly URLs
andyhume
79
6.8k
10 Git Anti Patterns You Should be Aware of
lemiorhan
PRO
659
61k
Fashionably flexible responsive web design (full day workshop)
malarkey
408
66k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
380
Helping Users Find Their Own Way: Creating Modern Search Experiences
danielanewman
31
3.1k
エンジニアに許された特別な時間の終わり
watany
106
230k
Refactoring Trust on Your Teams (GOTO; Chicago 2020)
rmw
35
3.4k
Transcript
by Naoki Kato ©Naoki Kato ©Naoki Kato 音の表現 Computer Science,
Engineering and Literacy
by Naoki Kato © Naoki Kato © Naoki Kato コンピュータにおける情報の表現
情報をビット列で表現すると コンピュータに入力(記憶)することができる なんらかの処理をすることができる はじめに ⽂字や絵図 映像 ⾳楽
by Naoki Kato © Naoki Kato © Naoki Kato 標本化
一定の間隔を置いてデータを取り出す 3時間おきに取り出す アナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324
by Naoki Kato © Naoki Kato © Naoki Kato 量子化
離散的な値に近似 2.5度置きの値に近似 標本化は時空間の量子化 アナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324
by Naoki Kato © Naoki Kato © Naoki Kato 符号化
離散的な値にコード(ビット列)を割当 22.5度を000,35度を111 アナログデータのディジタル化 0 5 10 15 20 25 30 35 40 1 2 3 4 5 6 7 8 9 101112131415161718192021222324 000 010 100 110 101 011 001 111 011 011 101 110 110 101 011 011・・・
by Naoki Kato © Naoki Kato © Naoki Kato 音は
音の基本
by Naoki Kato © Naoki Kato © Naoki Kato 音は空気の振動波
音の基本 波長:0.01秒 = 周波数:100Hz 時間
by Naoki Kato © Naoki Kato © Naoki Kato 音を感じる聴覚とは
音の基本 空気の振動 ⿎膜 ((((((((((((((((((((((((((((((( 蝸⽜ リンパ液が振動 基底膜 周波数によって 振動する場所が変わる 有⽑細胞から内⽿神経へ
by Naoki Kato © Naoki Kato © Naoki Kato 音は空気の振動波
周波数の違いを音の高低の違いとして認識する 音の基本 波長:0.01秒 ド レ 時間 = 周波数:100Hz
by Naoki Kato © Naoki Kato © Naoki Kato オクターブ
周波数が倍になると,1オクターブ上 音の基本
by Naoki Kato © Naoki Kato © Naoki Kato 実際の音(音色)
基本の周波数に加え,倍の周波数,三倍の周波数, などの音がまざったもの 音の基本
by Naoki Kato © Naoki Kato © Naoki Kato 実際の音(音色)
音の強弱(ビブラート)も音色として感じる 音の基本 + ポーン
by Naoki Kato © Naoki Kato © Naoki Kato 音のサンプリング(標本化)
一定周期(標本化周期)ごとの波の強さを記録 サンプリングレート =1/標本化周期 =標本化周波数 音のディジタル表現
by Naoki Kato © Naoki Kato © Naoki Kato 音の強さの量子化と符号化
波(音)の強さを段階的表現(量子化)し, 新しい値(コード)を与える(符号化) 音のディジタル表現 強さ 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
元の周期の1/12周期で取ると その点を通る正弦波に戻せる サンプリング定理 ただし より短波長(高周波)の正弦波は いくらでも考えられるので無視
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
サンプリング点を通る正弦波を作るが, 波長の短い高周波の正弦波はいくらでも作れるので もっとも長波長(低周波)を選択する サンプリング定理 v 0 標 本 化 周 波 数 より大きい成分 は捨てる
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
では1周期に何回とれば再現可能だろうか 6回?5回?4回?3回?2回?1回? サンプリング定理
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
サンプリング定理 3回 2回 2回未満 2回未満
by Naoki Kato © Naoki Kato © Naoki Kato 正弦波を再現するためには?
1周期に2回以下だとどうなる? サンプリング定理 v 0 標 本 化 周 波 数 折 り 返 し 成 分 元の周波数 よりも 長波長(短周波)の 正弦波が作れて しまう
by Naoki Kato © Naoki Kato © Naoki Kato サンプリング定理とは
最高周波数 f’’ の 2 倍より大きな周波数で (2回より多く)サンプリング すべての周波数の正弦波が忠実に再現 元の波も忠実に再現 サンプリング定理 周波数 f 周波数 f’ 周波数 f’’
by Naoki Kato © Naoki Kato © Naoki Kato エイリアシング
2×f’’ 以下でサンプリングすると サンプリング定理 f f’ f’’ v 0 標 本 化 周 波 数 元にはない低い⾳が⼊り込む
by Naoki Kato © Naoki Kato © Naoki Kato アンチエイリアシング
周期gでサンプリングするときは g/2 以上をカット サンプリング定理 f f’ f’’ v 0 標 本 化 周 波 数 元にはない低い⾳が⼊らないように ただし⾼い⾳は消える
by Naoki Kato © Naoki Kato © Naoki Kato サンプリングしたデータのサイズ
サンプリング周波数:44.1kHz 量子化ビット:16bit チャンネル数:2チャンネル(ステレオ) 1秒間につき 44100×16×2 ≒1,411,200bit ビットレート:1411kbps 5分の曲だと 1,411,200×5×60 = 423,360,000bit ≒ 53,000,000byte = 53MByte ≒ CD には14曲くらい マルチメディアデータのサイズ
by Naoki Kato © Naoki Kato © Naoki Kato データ圧縮
マルチメディアデータのデータ量は膨大 データ圧縮が重要となる 可逆圧縮 完全に元に戻せるが,圧縮率は低い あらゆる種類のデータに適用 非可逆圧縮 元に戻すことはできないが,圧縮率が高い データの種類ごとに異なる手法 マルチメディアデータでは, 非可逆圧縮 可逆圧縮の順に行うことが多い マルチメディアデータのサイズ
by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮
ランレングス符号 繰り返しの無駄をはぶく LZW圧縮 辞書を用いた圧縮法 パタン(単語)に対して符号を与える マルチメディアデータのサイズ AAABBCCCCCAC A3B2C5A1C1
by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮
ハフマン符号 出現確率に基づいて最適な符号を与える 5文字表現するには 3bit 必要なので 3×21 = 63bit 必要 ※個数の多いほうに1,少ない方に0 4bit×1+4bit×3+3bit×4+2bit×5+1bit×8 = 46bit マルチメディアデータのサイズ AAAAABBCABDDDEEAABDDE 個数 字 1 C 3 E 4 B 5 D 8 A 4 13 8 0 1 0 0 1 1 1 0 C 0011 E 1011 B 111 D 01 A 0
by Naoki Kato © Naoki Kato © Naoki Kato 音データにおける独特な非可逆圧縮技術
過少可聴限界 聞こえない音を無視 マスキング レベルの高い周波数の周りの周波数を無視 レベルの高い音の前後を無視 などなど マルチメディアデータのサイズ
by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象(静的スペクトルマスキング)
聞こえる音の大きさ マルチメディアデータのサイズ 強度⽐ 106倍 1012倍 0 60 120 強度(dB) 1018倍 180 0 20 100 1k 10k 可聴限界 可聴閾 ささやき 会話 叫び声 雷鳴 痛覚閾
by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象(動的スペクトルマスキング)
周波数が近い音がはいってくると 低音の振動が高音の振動にかぶる 高音が聞こえない マルチメディアデータのサイズ ⾼い⾳で振動 低い⾳で振動 蝸⽜の⼊り⼝側 10kHzだとこのように振動 100Hzだとこのように振動 基底膜 強さ
by Naoki Kato © Naoki Kato © Naoki Kato マスキング現象(テンポラルマスキング)
大きな音が入ってくると 音が消えてもしばらく振動(細胞も活性化したまま) 小さめの音が入ってきてもうまく聞こえない マルチメディアデータのサイズ 強さ 次の⾳ ) ) ))) ) ) ) ))) )
by Naoki Kato © Naoki Kato © Naoki Kato ファイル形式とコーデック
コーデック 音データの符号化・複合化方式 ファイル形式(コンテナ) 符号化した音データを格納するファイルの形式 音のデータファイル コンテナ コーデック(圧縮形式) WAV PCM(⾮圧縮), ADPCM, WMA, MP3, など AIFF 標準AIFF(⾮圧縮) MPEG MPEG Audio Layer Ⅰ,Ⅱ,Ⅲ MP4 AAC, MP3, Apple Lossless MP3 MP3
by Naoki Kato © Naoki Kato © Naoki Kato 標準的ファイルフォーマット
WAV:Windows Vista まで標準の音声記録用 WAVコンテナに非圧縮のLPCMデータを格納 WMA ASFコンテナにWMAコーデックを格納 AIFF:Mac標準の音声記録用 AIFFコンテナに非圧縮のLPCMデータを格納 音のデータファイル
by Naoki Kato © Naoki Kato © Naoki Kato よく使われるファイルフォーマット
MP3:MPEG Audio Layer-3 WAVコンテナにMP3コーデックのデータを格納 ビットレート128kbpsでは15kHzあたり以上をカット ビットレート192kbpsでは21kHzあたり以上をカット CDのビットレートの 1/10 MP3コーデックのデータを格納できるコンテナ AVI,MOV,MP4,MPEG-2システム,Ogg,ASF 音のデータファイル
by Naoki Kato © Naoki Kato © Naoki Kato よく使われるファイルフォーマット
MP4:MPEG 4-AAC MP4コンテナにAACコーデックのデータを格納 MP3より高圧縮率・高音質を目標 ビットレート128kbpsでは18kHzあたり以上をカット RealAudio 様々なコーデックを組合せて格納 ストリーミングに対応 音のデータファイル
by Naoki Kato © Naoki Kato © Naoki Kato 可逆圧縮を用いたファイルフォーマット
Apple Lossless コーデック m4a:MP4コンテナに格納 mov:MOVコンテナに格納(QuickTime) FLACコーデック fla:FLACコンテナに格納 ogg:Oggコンテナに格納 音のデータファイル
by Naoki Kato © Naoki Kato © Naoki Kato 演
演習 習 音の表現
by Naoki Kato © Naoki Kato © Naoki Kato 123appsのオーディオコンバータで
WAVファイルを M4A(高品質,最高品質) MP3(標準,エコノミー) に変換して, ファイルサイズと音質を比較しよう 演習
by Naoki Kato © Naoki Kato © Naoki Kato お
おし しま まい い 音の表現