Upgrade to Pro — share decks privately, control downloads, hide ads and more …

情報処理応用B第02回/InfoAdv02

Avatar for Kazuhisa Fujita Kazuhisa Fujita
September 27, 2023

 情報処理応用B第02回/InfoAdv02

Avatar for Kazuhisa Fujita

Kazuhisa Fujita

September 27, 2023
Tweet

More Decks by Kazuhisa Fujita

Other Decks in Education

Transcript

  1. 講義の予定 第1回 ガイダンス 第2回 情報の表現(画像,音声,文字コード) 第3回 ハードウェア・産業構造 第4回 ソフトウェアの種類・ライセンス・特許 第5回

    インターネットとビジネス 第6回 コンピュータネットワークの仕組み 第7回 情報セキュリティ 第8回 IoTとビッグデータ 第9回 人工知能1 -人工知能時代の到来- 第10回 人工知能2 -人工知能を実現するには- 第11回 人工知能3 -人工知能の技術- 第12回 人工知能4 -人工知能を使いこなす上で 必要な能力- 第13回 人工知能5 -人工知能研究者はどこに進 めばよいのか- 第14回 人工知能6 -プロンプトエンジニアリン グ- 第15回 人工知能7 -人工知能のリスク-
  2. データ量の単位 • ビット (bit) • データが2進数何桁で表されるかを表す量 • あるデータが001で表されるのならば3ビットとなる. • バイト

    (byte) • 8ビットで表されているデータの量を1バイトとする. • 例:1Gバイトのファイルは,8000000000個の2進数で出来ている. データ通信20Gバイト→1ヶ月に160000000000個の2進数を受信できる. WiFi 54Mbps→1秒間に54000000個の2進数を受信できる.
  3. データの圧縮・展開 • データを小さくすることを圧縮,圧縮したデータをデータをもとに戻 すことを展開という. • 圧縮:データを小さくすること. • 展開:圧縮されたデータをもとに戻すこと. • 可逆圧縮:元のデータに戻せる圧縮.

    • 非可逆圧縮:元のデータに戻せない圧縮.音楽,画像,動画などが対象. • 圧縮ファイルの形式例 • zip • WindowsやMacOSの標準圧縮形式. • 通常この形式以外を使うことはない. ファイル 圧縮 ファイル 圧縮 展開,解凍 データ量を小さくする データを元に戻す 発展:データ量>=情報量だから,データには余剰な部分がある. それを少なくすることでデータ量が減らせる(圧縮できる).
  4. 文字の表現 • コンピュータで文字を表現するためには,文字と2進数の対応を決め る必要がある. • 各人,各組織が勝手に文字と2進数の対応を決めると,他の人,他の組織 の人が読めなくなる. • 共通のルールが必要になる. •

    各文字に割り当てられる2進数表現,もしくは,文字と2進数の対応 関係(コード体系)のことを文字コードという. 文字 文字コード 0 0110000 A 1000001 z 1111010 文字 2進数 一対一に対応させる 例
  5. ASCIIコード(アスキーコード) • ASCII (American Standard Code for Information Interchange)コード はANSI

    (American National Standard Institute: 米国規格協会)により 開発された7ビットの文字コード. • 文字コードは8ビット(1バイト)で表現され,残り1ビットは世界中 で使用される様々な文字を割り当てて利用される. 文字 文字コード カッコ内16進 0 0110000 (30) A 1000001 (41) z 1111010 (7a)
  6. 音のデータに変化する流れ 標本化 符号化 音を時間方向に離散化す る. 一定時間ごとに音の大き さの数値を保存する. 大きさ 時間 大きさ

    時間 大きさ 時間 サンプリング 量子化 大きさ 時間 0000 0010 0100 0110 0100 0000 0001 0010 0010 0011 0100 0101 0110 音の大きさの数値を離散 化する. 時間と大きさの数値を2 進数に変換する.
  7. 典型的な音声データ • サンプリング周波数:44.1kHz • 1秒間あたりの44100個の数値で音声を表現 • 約0.000023秒ごとに音を分解 • 人の聞こえる上限の周波数(約20kHz)の2倍 •

    サンプリング周波数は音源の上限周波数の2倍必要(標本化定理) • 量子化ビット数:16bit(2B) • 65536段階で音の大きさを記述 • チャンネル数:2ch(ステレオ) 65536段階に 分ける. 1秒間あたり44100の数値がある. 大きさ 時間
  8. ハイレゾリューション(ハイレゾ)オーディオ • ハイレゾ・オーディオとは • CD音源よりサンプリング周波数か量子化数が多い音源もしくはそれを再生する 機器のこと • 人間の聞こえない音も再生,録音できるもの • 定義は曖昧

    • 日本オーディオ協会による定義 • アナログ機器 • 録音マイクの高域周波数性能: 40kHz以上が可能であること。 • アンプ高域再生性能: 40kHz以上が可能であること。 • スピーカー・ヘッドホン高域再生性能: 40kHz以上が可能であること。 • デジタル機器 • 録音フォーマット: FLAC or WAVファイル96kHz/24bitが可能であること • 入出力I/F: 96kHz/24bitが可能であること。 • ファイル再生: FLAC/WAVファイル96kHz/24bitに対応可能であること。(自己録再機は、FLACまたは WAVのどちらかのみで可とする) • 信号処理: 96kHz/24bitの信号処理性能が可能であること。 • デジタル・アナログ変換: 96kHz/24bitが可能であること。 (https://kakaku.com/kaden/article/high-resolution-audio/)
  9. ハイレゾオーディオ • ハイレゾ=高音質ではないことに注意 • ハイレゾはただ可聴領域をこえた高周波数を含む音を含むというだけ • ハイレゾでは 高周波数の音 (ギザギザの音)をギザギザのまま表現で きる.

    • ハイレゾで音が滑らかになることはない. • 高周波数成分を持たないほうが滑らかになる. • より高周波数成分を含めるということは,時間変化の激しい波を表現でき るようになるということ. ローレゾの音声 ハイレゾの音声 ギザギザを表現できず なめらかな波になる ギザギザを表現できる. 原音
  10. 音声ファイルの種類 • 非圧縮音声フォーマット • 圧縮していない. • データ量がものすごく大きい. • wavなど •

    非可逆圧縮音声フォーマット • 圧縮されている. • 圧縮されているデータは元の音声データに戻らない. • 簡単に言えば,人が音声から得られる情報に影響を与えない音を削除しデータ量 を減らす. • mp3,m4aなど • 可逆圧縮音声フォーマット • 圧縮されている. • 圧縮されているデータは元の音声データに戻すことが出来る. • 圧縮率は非可逆圧縮されたものより低い • FLAC,Apple Losslessなど ファイル 圧縮 ファイル 圧縮 データ量を小さくする 元のファイルに戻らない:非可逆圧縮 元のデータに戻る:可逆圧縮
  11. 音声ファイル • WAV • 非圧縮音声フォーマット. • MP3 (MPEG-1 Audio Layer-3)

    • 音声を圧縮して保存する形式. • 人間の聴覚心理を利用した圧縮がされている.非可逆圧縮. • mp4/m4a • MPEG-4規格の一部. • 非可逆圧縮. • MIDI • 音声そのものではなく,デジタル楽器の演奏データを保存することができ るファイル形式.
  12. 目の構造 • 瞳孔 • 光の量を調節する.カメラの絞りと同様の役割. • 水晶体 • 焦点を合わせる.カメラのレンズと同様の役割. •

    網膜 • 網膜にある視細胞が光を活動電位に変換する.カメ ラの光センサーと同じ役割をする. • 視細胞 • 桿体細胞と錐体細胞がある. • 桿体細胞は弱い光でも働くが色の区別はできない. • 錐体細胞は特定の周波数の光に応答し,色覚の基礎と なる.
  13. カラー画像の構成 (CG-ARTS, ディジタル画像処理) R G B 画素を拡大 (実際にディスプレイ を拡大すると1画素に つき3色見える)

    赤,緑,青の強さをあらわす画像がある. それら一組でカラー画像になる. 3つの画像を同時に表示することで,人間に は色がついて見える.
  14. 画像ファイルの種類 • Windows Bitmap (bmp) • Windowsの標準的な画像ファイル形式 • 基本的に無圧縮で保存するため,ファイルサイズが大きくなる. •

    JPEG (ジェイペグ,Joint Photographic Experts Group) • 非可逆圧縮のため,画像は圧縮され画質が劣化する. • 静止画像の主流な画像形式. • 自然画像の記録に向いている. • PNG (ピング,Portable Network Graphics) • 可逆圧縮のため,画像は圧縮されているが画質に劣化がない. • 透過度の情報も保存できる. • GIF (ジフ) • 256色以下の画像を扱うことができる. • 可逆圧縮のため,画像は圧縮されているが画質に劣化がない.256色に減色されて いる時点で劣化しているが… • アニメーションの保存もできる. ファイ ル 圧縮 ファイ ル 圧縮 データ量を小さくする 元のファイルに戻らない:非可逆圧縮 元のデータに戻る:可逆圧縮
  15. 3DCGの簡単な原理 • 3次元コンピュータグラフィックス (3D CG) • CG(コンピュータグラフィックス)のうち,コンピュータ上で立体空間の 情報を生成し,仮想的な3次元の世界を投影したCGのこと(IT用語辞典バ イナリ). •

    立体を作成し(モデリング),その立体の配置や素材,光源などを設定し, それに基づき画像を生成する(レンダリング). モデリング レンダリング 例え:コンピュータ内で フィギュアを作る 例え:コンピュータ内のフ ィギュアの写真を取る.
  16. VR・AR・MR • 仮想現実 (Virtual Reality: VR) • コンピュータの中に作られた仮想的な世界を,あたかも現実のように体験 させる技術 (ASCII.jpデジタル用語辞典)

    • 拡張現実 (Augmented Reality: AR) • 人が知覚する現実環境をコンピュータにより拡張する技術、およびコン ピュータにより拡張された現実環境そのもの(wikipedia) • 複合現実 (Mixed Reality: MR) • 現実空間と仮想空間を咬合し,現実のモノと仮想のモノがリアルタイムで 影響し合う新たな空間を構築する技術 (wikipedia) • VR,ARのビジネスは歴史が古く,昔から「サービスが出ては,話題 になり,そして消える」を繰り返し,なかなか普及しない.
  17. メタバース • コンピュータの中に構築された、3次元の仮想空間やそのサービス (wikipedia) • 仮想空間サービスの言い換えに過ぎず,昔から存在している. • Second Life (2003年サービス開始)

    • デジタルコンテンツをユーザが作ることが出来る. • 作ったコンテンツを売り買いすることが出来る. • 土地の売り買いレンタルが出来る. • Second Life内通貨はドルに変換可能 • FF14は現在最も普及しているメタバースとも言える. • Apexもメタバースと言えるかもしれない. • Apexで同窓会?
  18. 演習 • AR(Augmented Reality)の説明として,最も適切なものはどれか。(基本 情報技術者平成30年春期) 1. 過去に録画された映像を視聴することによって,その時代のその場所に いたかのような感覚が得られる。 2. 実際に目の前にある現実の映像の一部にコンピュータを使って仮想の情

    報を付加することによって,拡張された現実の環境が体感できる。 3. 人にとって自然な3次元の仮想空間を構成し,自分の動作に合わせて仮 想空間も変化することによって,その場所にいるかのような感覚が得ら れる。 4. ヘッドマウントディスプレイなどの機器を利用し人の五感に働きかける ことによって,実際には存在しない場所や世界を,あたかも現実のよう に体感できる。
  19. 演習 • AR(Augmented Reality)の説明として,最も適切なものはどれか。(基本 情報技術者平成30年春期) 1. 過去に録画された映像を視聴することによって,その時代のその場所に いたかのような感覚が得られる。 2. 実際に目の前にある現実の映像の一部にコンピュータを使って仮想の情

    報を付加することによって,拡張された現実の環境が体感できる。 3. 人にとって自然な3次元の仮想空間を構成し,自分の動作に合わせて仮 想空間も変化することによって,その場所にいるかのような感覚が得ら れる。 VRです. 4. ヘッドマウントディスプレイなどの機器を利用し人の五感に働きかける ことによって,実際には存在しない場所や世界を,あたかも現実のよう に体感できる。 VRです.