Slide 1

Slide 1 text

ゴルフ場の写り込み 判定AIモデルを作る 2020/12/22@Tellus Satellite Cafe Tisch合同会社 田上 健太

Slide 2

Slide 2 text

Who am I? • 田上健太(@regonn_haizine) • データサイエンスに関連するPodcast Regonn&Curry.fm • 島根県に2018年Iターン • フリーランスを経て、2020年6月起業 • Tisch合同会社 • 地方で衛星データを利用したビジネス • 地元の不動産企業と協力して、Tellus でのIoTセンサー情報を販売企画中 • Tellusユーザグループ 宙人(そらんちゅ) 立ち上げ

Slide 3

Slide 3 text

解説する記事 • 衛星画像の機械学習で最初に取り組んでみると良さそうなレベル感 • ゴルフ場が写っているかいないかの二値分類 • 全国どこにもゴルフ場があり、敷地も広いので判定しやすい • ゴルフ場以外のものにも応用しやすい https://sorabatake.jp/15199/

Slide 4

Slide 4 text

記事の特徴 • PyTorch • 論文で使われる際にTensorFlowに比べて採用が多くなってきている • 産業界(求人等)では依然TensorFlow(Keras)がメイン • torchvision, ImageFolder を利用 • 学習済みモデルを利用 • 画像関連ツールや学習済みモデルを利用することで、コード量を減らす

Slide 5

Slide 5 text

処理の流れ

Slide 6

Slide 6 text

データ準備 • ゴルフ場が写っている(Positive)、ゴルフ場が写っていない (Negative)画像をそれぞれ100枚用意 • ImageFolderというPyTorchの機能を使うために、0フォルダ (Negative)、1フォルダ(Positive)に分けて保存しておく (Githubには1000枚以上入っているので適宜調節してください)

Slide 7

Slide 7 text

学習 • ImageNetという1400万枚以上の教師ラベル付き 画像を学習済みのResNet18(深さが18層の畳込み ニューラルネットワーク)を利用する • 衛星画像を扱うのに、猫画像とか学習してるモデ ルを使って大丈夫なの?という話は発表の最後で 触れる

Slide 8

Slide 8 text

実際に判定 してみる • Tellusで衛星画像を取得して実際に判定してみる • もとの学習データが冬季のゴルフ場のデータだっ たので、予測も冬季のデータでないと精度が出な かった 0.1013 の確率で ゴルフ場が写っている 0.9889 の確率で ゴルフ場が写っている

Slide 9

Slide 9 text

記事執筆以降に知ったこと • TensorFlowだと、リモートセンシング用の学習済みモデルがある • Remote Sensing | TensorFlow Hub (tfhub.dev) • 関連論文※1 によると少ないデータ数でもImageNetの学習済みモデル より精度がよくなる傾向がある。ただし、十分なデータ数があると 精度は一緒になってくる • PyTorchの衛星画像学習済みモデルは探しても無さそうなので、も しデータ数が少なくて精度が出ない場合には試してみても良さそう ※1 [1911.06721] In-domain representation learning for remote sensing (arxiv.org)