Upgrade to Pro — share decks privately, control downloads, hide ads and more …

TUAT_ASC report

3f9b3af75a20688dbeb5de2ccd1bcaa3?s=47 y-kawagu
August 28, 2021

TUAT_ASC report

東京農工大学2021年度電子情報工学特別講義II
第4回講義 課題

3f9b3af75a20688dbeb5de2ccd1bcaa3?s=128

y-kawagu

August 28, 2021
Tweet

Transcript

  1. © Hitachi, Ltd. 2021. All rights reserved. 1 東京農工大学 2021年度

    電子情報工学特別講義II 第4回講義分 課題 以下のケースを読み、質問に回答せよ。不足情報は妥当な推論に基づいて補っても構わない。 あなたは或る企業のAI開発チームに所属している。あなたの開発チームは今回、屋外で継続的に録音される各5秒間の音のファイル (WAVファ イル) を入力として、虫の鳴き声か、カエルの鳴き声か、風鈴の音か、盆踊りの音楽か、それ以外かの計5クラスに分類する機能を有する音響 シーン分類のプログラムを作成することになった。顧客は国内のとある地方自治体であり、提供したプログラムは地域おこしに使われるらしいことが 分かっている。 あなたの同僚は、以下のステップからなる処理方式での実装を提案している。 1. WAVファイルから波形を読み込んでパワースペクトログラムを計算する。 2. パワースペクトログラムをカラーのJPEG画像として出力する。 3. 出力したJPEG画像を、画像の多クラス分類用に事前訓練されたモデルに入力し、特徴ベクトルを計算する。 4. 特徴ベクトルに単層パーセプトロンとsoftmax関数を施し、各次元がクラスと対応する5次元ベクトルに変換する。 5. 5次元ベクトルの最大値をとる次元に対応するクラスラベルを最終的な分類結果として出力する。 なお、同僚が使うつもりの事前訓練済みモデルは、「EfficientNet」と呼ばれるもので、「ImageNet」というデータセットで訓練された重みパラメタ も公開されており、ダウンロードして使用することができる (M. Tan and Q.V. Le, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” in ICML, 2019、および、J. Deng et al, “ImageNet: A Large-Scale Hierarchical Image Database,” in ICPR, 2009. を参考とせよ)。 訓練フェーズでは、事前訓練済みモデルの重みパラメタをダウンロードした値のまま固 定し、単層パーセプトロンの重みパラメタのみを最適化するつもりとのこと。 質問: 同僚が提案する処理方式に対し、問題を起こす可能性が高いと懸念される点を、少なくとも3個以上、考えうる限り列挙せよ。また、それぞ れの懸念点に対し、起こりうる問題を回避する方策を提案せよ。懸念点が逆に利点を有する可能性があれば、それについても論じよ。実験 的に検証する必要はない。妥当な仮説であれば列挙した分だけ加点の対象とする。