画像から撮影場所を当てる話 ~ 理論的背景 & どこが〇〇区らしいか ~

画像から撮影場所を当てる話理論的背景 & どこが〇〇区らしいか

https://share.streamlit.io/hi-king/tokyo_pho to2geo/main/scripts/web.py

どうしてできるのか

この写真は地球上のどこ？

先行研究1: im2gps (CVPR2008) -> 写真から撮影場所を当てるのは、巨大なデータセットがあればできる

-> 非常に多クラスになってしまうラベル付けを画像検索で解く検索似ている画像のGPSタグから、クエリ画像の撮影位置 • 専用の学習がいらない • クラス数がどんなに増えても大丈夫

先行研究2: PlaNet (ECCV2016) -> ニューラルネットのパラメータは世界中の画像を覚えることができる能力がある 26263クラス分類😇

VS Geoguessur 複数画像を入れられる改良も！

東京版を作る

データクローリングどうやってやる？ im2gps: flickrから画像収集 PlaNet: Google+から画像収集 • GeoGuessurみたいな方法でできない。。。？ ◦ Goole Maps
API !!! ▪ url = f'https://maps.googleapis.com/maps/api/streetview?location={latitude},{longitude}&size= 456x456&heading={heading}' • GPSと市区町村ってどうやって紐付ける？ ◦ 'https://geolonia.github.io/japanese-addresses/api/ja/{district}/{area}.json' ▪ 東京都/中央区.json ▪ 市区町村の”字”の座標一覧が取れるので、最も近い字からラベリング [ { "town": "佃二丁目", "koaza": "", "lat": 35.668796, "lng": 139.786583 }, { "town": "築地三丁目", "koaza": "",

やってみました！ • 隣接してる組み合わせは間違えやすい(渋谷・港、中央・千代田) • 旭川は東京と間違える場所ないのね。。。

過学習ではないのか？

-> ウマ娘はウマ!?!?

-> 予測が当たっているかも確かに重要だが、何がその判定を支えているか、というのはモデルの汎化性能の検証に重要ウマ娘のデザインだけでなく、背景のターフがウマ判定に大きく寄与していた (ただし、ウマ娘のデザインが完全に影響がないという結論でないこともまた注意 )

どこを見ているかを調べよう

その区らしさ上位を見てみる柵？

Grad-CAM -> NNの推論プロセスに沿った方法でどこを見ているか検証しよう

Grad-CAM -> NNの推論プロセスに沿った方法でどこを見ているか検証しよう 1. 入力画像からCNNのある層の特徴マップを得る 2. まぁとりあえず識別までやってみる。 3.
特徴マップの層まで、 ”目的のクラスだけ”誤差逆伝搬 4. backwardで得られたwとforwardで得られたAを掛けて(重み x 値)、最終的に1枚のGrad-CAMを得る

1. 入力画像からCNNのある層の特徴マップを得るただし、一般にこの段階では X, Y, channelの3次元であり、まだ画像に落とすことはできない。特定の1channelが直接港区らしさにのみ反応していればいいのだが、陽に制約を入れていないのでそんな都合よくは学習されない。

2. まぁとりあえず識別までやってみる。いくつかのFC層などを挟み、最終的に識別クラス数 (=区の数)のベクトルにしているわけで、とりあえずそこまで推論を進める。 (港区0.7, 中央区0.2などのスコアが出る )

3. 特徴マップの層まで、 ”目的のクラスだけ”誤差逆伝搬特徴マップのv(x, y, channel)ごとに、どれだけ目的のクラスへの影響度が得られると考えるこれをchannnelごとに平均取ることで、どのチャンネルがどれだけ港区らしさに重要か、のチャンネル重み wがえら
れる

4. backwardで得られたwとforwardで得られたAを掛けて (重み x 値)、最終的に1枚のGrad-CAMを得る

Grad-CAM -> NNの推論プロセスに沿った方法でどこを見ているか検証しよう 1. 入力画像からCNNのある層の特徴マップを得る 2. まぁとりあえず識別までやってみる。 3.
特徴マップの層まで、 ”目的のクラスだけ”誤差逆伝搬 4. backwardで得られたwとforwardで得られたAを掛けて(重み x 値)、最終的に1枚のGrad-CAMを得る

• 全く同じ or ほぼ同じオブジェクトの出現を見ていることはある • このタスクでは、実際その区にありがちなものであれば、手がかりにしてOK 柵でした！

おもしろ結果シリーズ

塀！港区は塀植え込みも港区らしさ

ポツンと家・木がある感路側帯がデカイ！ -> より抽象的な、田舎を認識している旭川(北海道)らしさ

中央区の水面から眺める江東区 -> 今回の問題設定では外れているが、実は正解江東区中央区

新橋の路地

ビル単体は難しい

面白かったコメントスラドに寄せられてたコメントたちはなかなか面白いです https://srad.jp/story/21/12/16/1551245/ :da:

GeoGuesserガチ勢はやっぱりみてるらしい京都人

画像から撮影場所を当てる話 ~ 理論的背景 & どこが〇〇区らしいか ~

画像から撮影場所を当てる話 ~ 理論的背景 & どこが〇〇区らしいか ~

Keisuke OGAKI

More Decks by Keisuke OGAKI

Other Decks in Science

Featured

Transcript