2020年12月22日開催
Tellus Satellite Cafe vol.5~ヘビーカスタマーによるデータ解析やコミュニティ紹介~
での登壇資料です。 https://youtu.be/_bjBcNiLMCw
ゴルフ場の写り込み判定AIモデルを作る2020/12/22@Tellus Satellite CafeTisch合同会社 田上 健太
View Slide
Who am I?• 田上健太(@regonn_haizine)• データサイエンスに関連するPodcastRegonn&Curry.fm• 島根県に2018年Iターン• フリーランスを経て、2020年6月起業• Tisch合同会社• 地方で衛星データを利用したビジネス• 地元の不動産企業と協力して、TellusでのIoTセンサー情報を販売企画中• Tellusユーザグループ 宙人(そらんちゅ) 立ち上げ
解説する記事• 衛星画像の機械学習で最初に取り組んでみると良さそうなレベル感• ゴルフ場が写っているかいないかの二値分類• 全国どこにもゴルフ場があり、敷地も広いので判定しやすい• ゴルフ場以外のものにも応用しやすいhttps://sorabatake.jp/15199/
記事の特徴• PyTorch• 論文で使われる際にTensorFlowに比べて採用が多くなってきている• 産業界(求人等)では依然TensorFlow(Keras)がメイン• torchvision, ImageFolder を利用• 学習済みモデルを利用• 画像関連ツールや学習済みモデルを利用することで、コード量を減らす
処理の流れ
データ準備• ゴルフ場が写っている(Positive)、ゴルフ場が写っていない(Negative)画像をそれぞれ100枚用意• ImageFolderというPyTorchの機能を使うために、0フォルダ(Negative)、1フォルダ(Positive)に分けて保存しておく(Githubには1000枚以上入っているので適宜調節してください)
学習• ImageNetという1400万枚以上の教師ラベル付き画像を学習済みのResNet18(深さが18層の畳込みニューラルネットワーク)を利用する• 衛星画像を扱うのに、猫画像とか学習してるモデルを使って大丈夫なの?という話は発表の最後で触れる
実際に判定してみる• Tellusで衛星画像を取得して実際に判定してみる• もとの学習データが冬季のゴルフ場のデータだったので、予測も冬季のデータでないと精度が出なかった0.1013 の確率でゴルフ場が写っている0.9889 の確率でゴルフ場が写っている
記事執筆以降に知ったこと• TensorFlowだと、リモートセンシング用の学習済みモデルがある• Remote Sensing | TensorFlow Hub (tfhub.dev)• 関連論文※1によると少ないデータ数でもImageNetの学習済みモデルより精度がよくなる傾向がある。ただし、十分なデータ数があると精度は一緒になってくる• PyTorchの衛星画像学習済みモデルは探しても無さそうなので、もしデータ数が少なくて精度が出ない場合には試してみても良さそう※1 [1911.06721] In-domain representation learning for remote sensing (arxiv.org)