Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

情報処理工学03資料 /infoeng03

情報処理工学03資料 /infoeng03

Kazuhisa Fujita

September 29, 2022
Tweet

More Decks by Kazuhisa Fujita

Other Decks in Technology

Transcript

  1. 可逆圧縮と不可逆圧縮 • 可逆圧縮 • 圧縮前のデータと展開後のデータが完全に一致する事ができる(完全に復 元できる)圧縮方法 • 文書ファイルなどで用いられる圧縮は可逆圧縮 • 元通りに戻らなければならないから

    • 非可逆圧縮 • 圧縮前のデータと展開後のデータが一致しない(完全に復元できない)圧 縮方法 • 画像,音声,映像データに用いられる. • それらのデータは完全に復元できなくても,人間にとってデータが意味す る事柄が認識可能であれば問題ないため.
  2. データ圧縮の仕組みの例 • 「あああいううええええおおおおお」を圧縮することを考える. • 文字とその文字が並んでいる個数 (Run Length) の形式で変換して みると •

    「あ3い1う2え4お5」となる. • この結果もともと15文字だったものが,10文字に圧縮された. • この方法をランレングス法と呼ぶ. • 白黒画像の様に同じ文字が連続して続くことが多い場合に効果を発 揮する. • ただし,この方法では同じ文字が連続して続くことが少ない場合は 効果はあまりない. 余談
  3. 圧縮ファイルの種類 • ZIP • Windows,Macで初めから扱える圧縮方式. • 最も普及しており,通常この圧縮形式を用いる. • RAR •

    圧縮率がzipよりも高い. • gzip • Unix系システムでよく用いられる. • LHA • 1990年代から2000年代初頭にかけて日本でよく用いられた圧縮形式. • 古いデータがlzh形式で保存されている場合がある.
  4. 文字の表現 • コンピュータで文字を表現するためには,文字と2進数の対応を決 める必要がある. • 各人,各組織が勝手に文字と2進数の対応を決めると,他の人,他の組織 の人が読めなくなる. • 共通のルールが必要になる. •

    各文字に割り当てられる2進数表現,もしくは,文字と2進数の対 応関係(コード体系)のことを文字コードという. 文字 文字コード 0 0110000 A 1000001 z 1111010 文字 2進数 一対一に対応させる 例
  5. ASCIIコード(アスキーコード) • ASCII (American Standard Code for Information Interchange)コー ドはANSI

    (American National Standard Institute: 米国規格協会)に より開発された7ビットの文字コード. • 文字コードは8ビット(1バイト)で表現され,残り1ビットは世界 中で使用される様々な文字を割り当てて利用される. 文字 文字コード カッコ内16進 0 0110000 (30) A 1000001 (41) z 1111010 (7a)
  6. 演習 • 英字Hのアスキーコード(ASCII)は16進数で表すと48である.英 字Mのコードを16進数で表したのはどれか.第42回ME2種 1. 4C 2. 4D 3. 53

    4. 5D 5. 77 H,I,J,K,L,Mだから,MはHの5 つあとにある.ASCIIコードはアルフ ァベット順に並んでいるから, 4816 + 516 = 4𝐷16
  7. 音声のデジタル化の流れ 大きさ 時間 大きさ 時間 大きさ 時間 サンプリング 量子化 符号化

    大きさ 時間 0000 0001 0010 0011 0100 0101 0110 0111 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 量子化
  8. 量子化 • 大きさの離散化を量子化という. • 大きさの分割の数をビットで表したものを量子化ビット数という. • 2の量子化ビット数乗の段階で大きさが分割される. 大きさ 時間 大きさ

    時間 大きさ 時間 サンプリング 量子化 例:量子化ビット数が8ビットのとき • 大きさが8桁の2進数で表される. • 8桁の2進数が表すことができる数の個数は2^8=256である. • つまり,量子化ビット数が8ビットのときは,大きさが256段階に分割される.
  9. 符号化 • 時間,大きさの数値を2進数にする. 大きさ 時間 符号化 大きさ 時間 0000 0001

    0010 0011 0100 0101 0110 0111 0000 0001 0010 0011 0100 0101 0110 0111 1000 1001
  10. 音声のデータ量 • 音声のデータ量(ビット)= 量子化ビット数(ビット)xサンプリング周波数x音声の長さ(秒) 量子化ビット数が8bitのとき 大きさが8桁の2進数で表される. 2進数8桁のデータ量は8bitである. 量子化ビット数=1つの大きさの数値 あたりのデータ量 サンプル数(数値の数)=

    サンプリング周波数 x 音声の長さ • 量子化ビット数は大きさの数値(サンプル)1個あたりのデータ量 • サンプリング周波数は1秒あたりの大きさの数値の数 • 量子化ビット数xサンプリング周波数=1秒あたりのデータ量
  11. 音声のデータ量の例 • CD音源1秒あたりのデータ量 • サンプリング周波数が44.1kHzなので,1チャンネルあたり1秒間に44100個 の数値がある. • CDの量子化ビット数は16bitなので,1つ音の大きさの数値が持つデータ量 は16bit (2B)である.

    • よって,1チャンネルあたり1秒間に88200B = 88.2kBのデータ量がある. • 音声は2チャンネル(ステレオ)なので,CD音源1秒あたりのデータ量は 176.4kBとなる.
  12. 第33回ME2種 • 生体電気信号を500μs間隔でサンプルした.復元できる周波数の 理論的上限は何Hz未満か. 1. 100 2. 200 3. 500

    4. 1000 5. 2000 求め方 1. サンプリング周波数を求める. 周波数𝑓[Hz] = 1 周期𝑇[s] 2. サンプリング周波数から理論上の上限の周波数を求める. サンプリング周波数の1/2の周波数の信号を再現できる. 1秒間にサンプリング周波数[個]の数値がある. つまり,数値と数値の間隔は1/サンプリング周波数[秒]となる. この間隔をサンプリング周期という.
  13. 第33回ME2種 • 生体電気信号を500μs間隔でサンプルした.復元できる周波数の 理論的上限は何Hz未満か. 1. 100 2. 200 3. 500

    4. 1000 5. 2000 周波数は周期の逆数なので,サンプリング周波数は 1/500μs=1/0.5ms=1000/0.5=2000Hz である.よって,サンプリング定理より,復元可能な周波数の 上限は2000/2=1000Hzである. 別解: 周波数は周期の逆数なので,サンプリング間隔の2倍の周期の波が復元可能であると言い換え られる. よって500μsの2倍の1000μs=1msの周期の波を復元できる. 周波数は周期の逆数なので,1msの周期の波は1kHzの周波数の波である.
  14. 演習 • -1 V から +1 V の電圧を量子化ビット数10bitでAD変換する.電圧 の 分解能[mV]はいくらか.第32回臨床工学技士国家試験

    求め方 1. ビットから何段階に分けられるかを計算する. ビット数=2進数の桁数 2^桁数段階に分割される. 2. 最大値と最小値の差を計算する. 3. 2で計算した差を1で計算した数で割る. 1V -1V 最大と最小の差は2V 210個に分割される
  15. 演習 • -1 V から +1 V の電圧を量子化ビット数10bitでAD変換する.電圧 の 分解能[mV]はいくらか.第32回臨床工学技士国家試験

    10ビットは2進数10桁のデータ量なので,10ビットで表すことが できる数は2^10=1024個である. -1Vから+1Vの電圧なので,最小値と最大値の差は2Vである. 分解能は2/1024=0.001953…≒0.002V=2mVである. 1V -1V 最大と最小の差は2V 210個に分割される
  16. 演習 • 0から2Vの電圧を,分解能1mV以下でAD変換するときに必要な最 小量子化ビット数はどれか.第27回臨床工学技士国家試験 1. 8 2. 9 3. 10

    4. 11 5. 12 電圧の最大値が2V=2000mVなので,1mVで分割すると, 2000 1 = 2000個 に分割される.2000に近く,2000より大きい2のn乗の数は 211 = 2048 である.よって11ビットが答えとなる
  17. 演習 • 帯域が1から100Hzのアナログ信号をサンプリングするとき,エイ リアシングを起こさないサンプリング間隔の最大値[ms]はどれか. 第34回臨床工学技士国家試験 1. 1.25 2. 2.5 3.

    5 4. 10 5. 20 サンプリング定理から,必要なサンプリング周波 数は200Hzである.サンプリング間隔はサンプリ ング周波数の逆数だから, 1 200 = 0.005𝑠 = 5𝑚𝑠
  18. 演習 • サンプリング周波数40kHz,1データを8ビットでディジタル化され た信号を10分間分保存するには最低何Mバイトのメモリが必要か. 第26回ME2種 1. 24 2. 196 3.

    246 4. 1960 5. 2460 サンプリング周波数は,1秒あたりの値の個数である. この問題では,1秒あたり40000個の値がある.1つの 値あたり8ビットであるから,1秒あたりのデータ量は 40000 × 8 = 320000ビット である.信号は10分 = 600秒 あるので,信号のデータ 量(バイト)は 320000 × 600 8 = 24 × 106 = 24𝑀バイト となる.