Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TUAT_ASC report
Search
y-kawagu
August 28, 2021
Education
0
220
TUAT_ASC report
東京農工大学2021年度電子情報工学特別講義II
第4回講義 課題
y-kawagu
August 28, 2021
Tweet
Share
More Decks by y-kawagu
See All by y-kawagu
半自動楽器ロボによる演奏支援システムの開発
yohekawag
0
670
Introduction of DCASE 2021 Challenge Task 2 / dcase2021task2
yohekawag
0
750
Other Decks in Education
See All in Education
仮説の取扱説明書/User_Guide_to_a_Hypothesis
florets1
4
380
フィードバックの伝え方、受け身のココロ / The Way of Feedback: Words and the Receiving Heart
spring_aki
1
140
自分だけの、誰も想像できないキャリアの育て方 〜偶然から始めるキャリアプラン〜 / Career planning starting by luckly v2
vtryo
1
140
Linuxのよく使うコマンドを解説
mickey_kubo
1
270
データで見る赤ちゃんの成長
syuchimu
0
280
みんなのコード 2024年度活動報告書/ 2025年度活動計画書
codeforeveryone
0
290
AIの時代こそ、考える知的学習術
yum3
2
200
理想の英語力に一直線!最高効率な英語学習のすゝめ
logica0419
6
390
2025年度春学期 統計学 第11回 分布の「型」を考える ー 確率分布モデルと正規分布 (2025. 6. 19)
akiraasano
PRO
0
170
CHARMS-HP-Banner
weltraumreisende
0
810
Técnicas y Tecnología para la Investigación Neurocientífica en el Neuromanagement
jvpcubias
0
130
令和政経義塾第2期説明会
nxji
0
200
Featured
See All Featured
Why Our Code Smells
bkeepers
PRO
339
57k
How GitHub (no longer) Works
holman
315
140k
Fashionably flexible responsive web design (full day workshop)
malarkey
407
66k
For a Future-Friendly Web
brad_frost
180
9.9k
Facilitating Awesome Meetings
lara
55
6.5k
GraphQLとの向き合い方2022年版
quramy
49
14k
Practical Tips for Bootstrapping Information Extraction Pipelines
honnibal
PRO
23
1.4k
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.4k
Typedesign – Prime Four
hannesfritz
42
2.8k
Bootstrapping a Software Product
garrettdimon
PRO
307
110k
Navigating Team Friction
lara
189
15k
RailsConf 2023
tenderlove
30
1.2k
Transcript
© Hitachi, Ltd. 2021. All rights reserved. 1 東京農工大学 2021年度
電子情報工学特別講義II 第4回講義分 課題 以下のケースを読み、質問に回答せよ。不足情報は妥当な推論に基づいて補っても構わない。 あなたは或る企業のAI開発チームに所属している。あなたの開発チームは今回、屋外で継続的に録音される各5秒間の音のファイル (WAVファ イル) を入力として、虫の鳴き声か、カエルの鳴き声か、風鈴の音か、盆踊りの音楽か、それ以外かの計5クラスに分類する機能を有する音響 シーン分類のプログラムを作成することになった。顧客は国内のとある地方自治体であり、提供したプログラムは地域おこしに使われるらしいことが 分かっている。 あなたの同僚は、以下のステップからなる処理方式での実装を提案している。 1. WAVファイルから波形を読み込んでパワースペクトログラムを計算する。 2. パワースペクトログラムをカラーのJPEG画像として出力する。 3. 出力したJPEG画像を、画像の多クラス分類用に事前訓練されたモデルに入力し、特徴ベクトルを計算する。 4. 特徴ベクトルに単層パーセプトロンとsoftmax関数を施し、各次元がクラスと対応する5次元ベクトルに変換する。 5. 5次元ベクトルの最大値をとる次元に対応するクラスラベルを最終的な分類結果として出力する。 なお、同僚が使うつもりの事前訓練済みモデルは、「EfficientNet」と呼ばれるもので、「ImageNet」というデータセットで訓練された重みパラメタ も公開されており、ダウンロードして使用することができる (M. Tan and Q.V. Le, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” in ICML, 2019、および、J. Deng et al, “ImageNet: A Large-Scale Hierarchical Image Database,” in ICPR, 2009. を参考とせよ)。 訓練フェーズでは、事前訓練済みモデルの重みパラメタをダウンロードした値のまま固 定し、単層パーセプトロンの重みパラメタのみを最適化するつもりとのこと。 質問: 同僚が提案する処理方式に対し、問題を起こす可能性が高いと懸念される点を、少なくとも3個以上、考えうる限り列挙せよ。また、それぞ れの懸念点に対し、起こりうる問題を回避する方策を提案せよ。懸念点が逆に利点を有する可能性があれば、それについても論じよ。実験 的に検証する必要はない。妥当な仮説であれば列挙した分だけ加点の対象とする。