Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
TUAT_ASC report
Search
y-kawagu
August 28, 2021
Education
0
220
TUAT_ASC report
東京農工大学2021年度電子情報工学特別講義II
第4回講義 課題
y-kawagu
August 28, 2021
Tweet
Share
More Decks by y-kawagu
See All by y-kawagu
半自動楽器ロボによる演奏支援システムの開発
yohekawag
0
660
Introduction of DCASE 2021 Challenge Task 2 / dcase2021task2
yohekawag
0
750
Other Decks in Education
See All in Education
Webリテラシー基礎
takenawa
0
14k
CHARMS-HP-Banner
weltraumreisende
0
580
2025/06/05_読み漁り学習
nag8
0
190
Alumnote inc. Company Deck
yukinumata
0
1.5k
生態系ウォーズ - ルールブック
yui_itoshima
1
240
サンキッズゾーン 春日井駅前 ご案内
sanyohomes
0
760
ANS-C01_2回不合格から合格までの道程
amarelo_n24
1
300
『会社を知ってもらう』から『安心して活躍してもらう』までの プロセスとフロー
sasakendayo
0
250
OJTに夢を見すぎていませんか? ロールプレイ研修の試行錯誤/tryanderror-in-roleplaying-training
takipone
1
210
万博非公式マップとFOSS4G
barsaka2
0
880
Open Source Summit Japan 2025のボランティアをしませんか
kujiraitakahiro
0
800
アウトプット0のエンジニアが半年でアウトプットしまくった話 With JAWS-UG
masakiokuda
2
370
Featured
See All Featured
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
48
9.6k
Gamification - CAS2011
davidbonilla
81
5.4k
Become a Pro
speakerdeck
PRO
29
5.5k
The Cult of Friendly URLs
andyhume
79
6.5k
The MySQL Ecosystem @ GitHub 2015
samlambert
251
13k
Optimising Largest Contentful Paint
csswizardry
37
3.4k
Writing Fast Ruby
sferik
628
62k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
7
820
Reflections from 52 weeks, 52 projects
jeffersonlam
351
21k
What's in a price? How to price your products and services
michaelherold
246
12k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
29
1.8k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
Transcript
© Hitachi, Ltd. 2021. All rights reserved. 1 東京農工大学 2021年度
電子情報工学特別講義II 第4回講義分 課題 以下のケースを読み、質問に回答せよ。不足情報は妥当な推論に基づいて補っても構わない。 あなたは或る企業のAI開発チームに所属している。あなたの開発チームは今回、屋外で継続的に録音される各5秒間の音のファイル (WAVファ イル) を入力として、虫の鳴き声か、カエルの鳴き声か、風鈴の音か、盆踊りの音楽か、それ以外かの計5クラスに分類する機能を有する音響 シーン分類のプログラムを作成することになった。顧客は国内のとある地方自治体であり、提供したプログラムは地域おこしに使われるらしいことが 分かっている。 あなたの同僚は、以下のステップからなる処理方式での実装を提案している。 1. WAVファイルから波形を読み込んでパワースペクトログラムを計算する。 2. パワースペクトログラムをカラーのJPEG画像として出力する。 3. 出力したJPEG画像を、画像の多クラス分類用に事前訓練されたモデルに入力し、特徴ベクトルを計算する。 4. 特徴ベクトルに単層パーセプトロンとsoftmax関数を施し、各次元がクラスと対応する5次元ベクトルに変換する。 5. 5次元ベクトルの最大値をとる次元に対応するクラスラベルを最終的な分類結果として出力する。 なお、同僚が使うつもりの事前訓練済みモデルは、「EfficientNet」と呼ばれるもので、「ImageNet」というデータセットで訓練された重みパラメタ も公開されており、ダウンロードして使用することができる (M. Tan and Q.V. Le, “EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks,” in ICML, 2019、および、J. Deng et al, “ImageNet: A Large-Scale Hierarchical Image Database,” in ICPR, 2009. を参考とせよ)。 訓練フェーズでは、事前訓練済みモデルの重みパラメタをダウンロードした値のまま固 定し、単層パーセプトロンの重みパラメタのみを最適化するつもりとのこと。 質問: 同僚が提案する処理方式に対し、問題を起こす可能性が高いと懸念される点を、少なくとも3個以上、考えうる限り列挙せよ。また、それぞ れの懸念点に対し、起こりうる問題を回避する方策を提案せよ。懸念点が逆に利点を有する可能性があれば、それについても論じよ。実験 的に検証する必要はない。妥当な仮説であれば列挙した分だけ加点の対象とする。