Upgrade to Pro — share decks privately, control downloads, hide ads and more …

ドラレコ映像認識AIをData-Centricアプローチで改良した話【DeNA Tech...

ドラレコ映像認識AIをData-Centricアプローチで改良した話【DeNA TechCon 2022】

Lightning Talks vol.3

資料内でのリンク集:
p2, https://techcon.dena.com/2021/session/24/
p4, https://datacentricai.org/

◆ You Tube
https://youtu.be/9heaFqbWP94

◆ You Tube チャンネル登録はこちら↓
https://youtube.com/c/denatech?sub_confirmation=1

◆ Twitter
https://twitter.com/DeNAxTech

◆ DeNA Engineering
https://engineering.dena.com/

◆ DeNA Engineer Blog
https://engineering.dena.com/blog/

◆ DeNA TechCon 2022 公式サイト
https://techcon2022.dena.dev/spring/

DeNA_Tech

March 17, 2022
Tweet

More Decks by DeNA_Tech

Other Decks in Technology

Transcript

  1. データが少ない時に何を考える? 1. データが増えれば精度が上がりそうなので、時間をかけてもっと多くの映像にアノテーションする 映像自体はあるが、ここまでの数倍の時間アノテーションしてもレアクラスは必要な量が集まらないので避けたい 2. モデルや学習の仕方を変えて頑張る (例) • 最新の論文を参考に強いモデルを作る •

    ドメイン知識を駆使した工夫を入れる • ハイパーパラメータをチューニングする どれも大事な技だが、初手で最低限はやっている。時間をかけても精度が大きく上がるかは不明なためまずは避けたい やはりデータを増やしたい。ランダムでダメならば、 レアクラスのデータを効率的に集める仕組みを作る
  2. Data-Centric AI データを集めれば良いなんてそれは当たり前?? しかし、意外と軽視されてきた領域の話でもある Andrew Ng先生が2021年に提唱し注目が高まる「Data-Centric AI」という概念の話になる Data-Centric AI Model-Centric

    AI (従来注目されてきた領域) データを固定して、 機械学習モデルを改良していく。 ・どんなモデルを使う? ・どんな学習を行う? (最近注目されつつある領域) 機械学習モデルを固定して、 データを改良していく。 ・どうデータを収集する? ・どうノイズを減らす? 個別には目新しい話ではないが、これまで体系的に扱われてきていなかった Data-Centric AIについて詳しくはhttps://datacentricai.org/を参照