Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
201803生態学会山北集会
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
naru-T
March 19, 2018
Research
250
0
Share
201803生態学会山北集会
naru-T
March 19, 2018
More Decks by naru-T
See All by naru-T
Naru Tsutsumida
narut
0
1.8k
Other Decks in Research
See All in Research
データサイエンティストをめぐる環境の違い2025年版〈一般ビジネスパーソン調査の国際比較〉
datascientistsociety
PRO
0
1.2k
論文紹介 "ReSim: Reliable World Simulation for Autonomous Driving"
kogo
0
420
"主観で終わらせない"定性データ活用 ― プロダクトディスカバリーを加速させるインサイトマネジメント / Utilizing qualitative data that "doesn't end with subjectivity" - Insight management that accelerates product discovery
kaminashi
16
24k
2026 東京科学大 情報通信系 研究室紹介 (大岡山)
icttitech
0
2.4k
Any-Optical-Model: A Universal Foundation Model for Optical Remote Sensing
satai
3
520
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
910
The Fusion of Mathematical Optimization and AI (MOAI): History and Outlook
mickey_kubo
1
100
The Landscape of Agentic Reinforcement Learning for LLMs: A Survey
shunk031
4
870
【SIGGRAPH Asia 2025】Lo-Fi Photograph with Lo-Fi Communication
toremolo72
0
150
「行ける・行けない表」による地域公共交通の性能評価
bansousha
0
140
量子コンピュータの紹介
oqtopus
0
270
LOSの検討(λ Kansai 2026 in Winter)
motopu
0
120
Featured
See All Featured
Designing Powerful Visuals for Engaging Learning
tmiket
1
350
Mind Mapping
helmedeiros
PRO
1
160
Lessons Learnt from Crawling 1000+ Websites
charlesmeaden
PRO
1
1.2k
Improving Core Web Vitals using Speculation Rules API
sergeychernyshev
21
1.5k
The Curious Case for Waylosing
cassininazir
0
320
Building a Modern Day E-commerce SEO Strategy
aleyda
45
9k
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
1
530
Fantastic passwords and where to find them - at NoRuKo
philnash
52
3.7k
How to Align SEO within the Product Triangle To Get Buy-In & Support - #RIMC
aleyda
2
1.5k
Build The Right Thing And Hit Your Dates
maggiecrowley
39
3.1k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
220
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Transcript
大規模リモートセンシングデータをもちいた土地 被覆分類 堤田 成政 京都大学 地球環境学堂
内容 大規模リモートセンシングデータをもちいた土地被覆分類 ◦ 1.データが大きいので・・・ ▪ DL→分析前処理までが大変 ▪ 分析が大変 ◦ 2.教師データの収集が大変(教師付き分類)
▪ なんだかんだいって教師データにすべてがかかっている ◦ 3.精度評価の辛み ▪ 精度評価は評価サンプルにすべてがかかっている ▪ 精度評価の辛み ▪ 空間精度評価の試み ▪ 誤差を含んだ分類図利用 ▪ ポリゴンデータの精度評価 ◦ まとめ:ふるくてあたらしい土地被覆分類研究
1.データが大きいので・・・ • DL→分析前処理までが大変 ◦ 使用データがオープンデータであればGoogle Earth Engine (GEE)
データが大きいので・・・ • 分析が大変 (Rを想定) ◦ nvblas (on nvidia GPU)を使う ◦ ラスターの使用RAMの上限を引き伸ばすrasterOptions(maxmemory
= 1e10) ◦ raster::clusterRを使う ◦ おそらくPythonでも一緒(numpy, rasterioまわりをいじる?) • これだけで数倍速! ◦ 個人的にはRもpythonも速度的には大した差がないのでは
分析例1(機械学習のためのGEE) • データ収集(AVHRR CDR. 1982-2016, Daily =(365.25×35=12783 mosaiced images), 5km
res.)(計約3.4TB分)) • 下処理 (QA処理、バンドごと平均・標準偏差(一年ごと)=(12バンド×35年) • 結果をGoogle Driveへ出力 (12 パラメータ×35年 = 約266MB/年 = 9.3GB)) • Google DriveからDL • RF + Logit・・・などで分析 (with nvblas, cluserR) • 注:単純な機械学習ならGEEで可
分析例2(統計モデルのためのGEE) • データ収集(MOD09GQ. 2001-2016, Daily =(365.25×16=5844 mosaiced images), 250m res.)
(計約1.5TB分)) • 下処理 (QA処理、Harmonic analysis(一年ごと)) • 結果をGoogle Driveへ出力 (4 パラメータ×16年 = 64 images (約250MB/image = 16GB)) • Google DriveからDL • bfastによる時系列分析 (with nvblas, cluserR)
2.教師データの収集が大変(教師付き分類) • なんだかんだいって教師データにすべてがかかっている ◦ よい教師データ→(モデル) →よい結果 ◦ 悪い教師データ→(どんなによいモデルでも)→わるい結果 • 教師データのオリジナリティがすべて ◦
分類クラス数・定義はデータ作成者次第 ◦ 分類図ユーザーの需要とマッチしない ▪ 誰のための分類図? • 自分で集める ◦ フィールドワーク ◦ Google Earth など • 教師データをシチズンサイエンスとして集める ◦ Geo-wiki ◦ SACLAJ など Geo-wiki. Fritz et al. (2017) in Scientific data SALCAJ
3. 精度評価の辛み • 精度評価は評価サンプルにすべてがかかっている ◦ 評価サンプルはランダムサンプリング?階層サンプリング? ◦ 精度評価は評価サンプルからの相対評価 ▪ 異なる評価サンプルによる精度評価は比較不能
▪ 評価サンプルの精度を検証すべき? ▪ 誤差は伝搬する • 精度評価の辛み ◦ 全体精度(Overall accuracy) ◦◦% = 全体誤差 100 - ◦◦% ◦ 精度(誤差)の空間的な偏り ▪ 空間データに適用した非空間分類モデルの誤差はランダムでない ▪ ランダムサンプリングされた評価サンプルをつかっても代表性があるとは限らない
誤差を含んだ分類図利用 • 誤差は伝搬する ◦ 土地被覆変化分析の怪(Post-classification comparison) ▪ 2時点比較(Post-classification comparison)はただしい? •
例:0.75×0.75≒0.56 ▪ 時系列評価サンプル収集は可能か? • 例:2000年ー2010年の土地被覆変化 ▪ 精度評価は評価サンプルからの相対評価 ◦ 2時点での評価サンプルがあれば変化マトリックスの作成が可能
ポリゴンデータの精度評価 • ポリゴンデータ精度評価はかなり難しい ◦ 作成したポリゴンと参照ポリゴンを比べて・・・ ▪ 面積の重複率? ▪ 外縁の長さ?(例:海岸線) ▪
角度ずれ?(例:パズル) Su and Zhang, ISPRS 2017
まとめ:ふるくてあたらしい土地被覆分類研究 • 衛星・ドローン画像を分類する ◦ 使用データを決める(解像度) ▪ 使用データがおおすぎて決めれない ◦ 分類クラスを決める ▪
おれさま分類図はニーズにあわない • 人によって定義はバラバラ ▪ ユーザーがほしい分類図とは? ◦ 教師サンプルをつくる ▪ 多様なクラス組み合わせが可能な教師サンプル をどうつくる? ◦ モデルを組む ▪ 適切なモデル? ◦ 精度分析する ▪ 適切な参照データ? ▪ 適切な精度分析? ▪ 精度のばらつき • それ以外で分類する ◦ OSM ◦ Mapillary ◦ VR?