TUAT_ASC report

© Hitachi, Ltd. 2021. All rights reserved. 1 東京農工大学 2021年度
電子情報工学特別講義II 第4回講義分課題以下のケースを読み、質問に回答せよ。不足情報は妥当な推論に基づいて補っても構わない。あなたは或る企業のAI開発チームに所属している。あなたの開発チームは今回、屋外で継続的に録音される各5秒間の音のファイル (WAVファイル) を入力として、虫の鳴き声か、カエルの鳴き声か、風鈴の音か、盆踊りの音楽か、それ以外かの計5クラスに分類する機能を有する音響シーン分類のプログラムを作成することになった。顧客は国内のとある地方自治体であり、提供したプログラムは地域おこしに使われるらしいことが分かっている。あなたの同僚は、以下のステップからなる処理方式での実装を提案している。 1. WAVファイルから波形を読み込んでパワースペクトログラムを計算する。 2. パワースペクトログラムをカラーのJPEG画像として出力する。 3. 出力したJPEG画像を、画像の多クラス分類用に事前訓練されたモデルに入力し、特徴ベクトルを計算する。 4. 特徴ベクトルに単層パーセプトロンとsoftmax関数を施し、各次元がクラスと対応する5次元ベクトルに変換する。 5. 5次元ベクトルの最大値をとる次元に対応するクラスラベルを最終的な分類結果として出力する。なお、同僚が使うつもりの事前訓練済みモデルは、「EfficientNet」と呼ばれるもので、「ImageNet」というデータセットで訓練された重みパラメタも公開されており、ダウンロードして使用することができる (M. Tan and Q.V. Le, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” in ICML, 2019、および、J. Deng et al, “ImageNet: A Large-Scale Hierarchical Image Database,” in ICPR, 2009. を参考とせよ)。訓練フェーズでは、事前訓練済みモデルの重みパラメタをダウンロードした値のまま固定し、単層パーセプトロンの重みパラメタのみを最適化するつもりとのこと。質問：同僚が提案する処理方式に対し、問題を起こす可能性が高いと懸念される点を、少なくとも3個以上、考えうる限り列挙せよ。また、それぞれの懸念点に対し、起こりうる問題を回避する方策を提案せよ。懸念点が逆に利点を有する可能性があれば、それについても論じよ。実験的に検証する必要はない。妥当な仮説であれば列挙した分だけ加点の対象とする。

TUAT_ASC report

TUAT_ASC report

y-kawagu

More Decks by y-kawagu

Other Decks in Education

Featured

Transcript

© Hitachi, Ltd. 2021. All rights reserved. 1 東京農工大学 2021年度