Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
201803生態学会山北集会
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
naru-T
March 19, 2018
Research
250
0
Share
201803生態学会山北集会
naru-T
March 19, 2018
More Decks by naru-T
See All by naru-T
Naru Tsutsumida
narut
0
1.8k
Other Decks in Research
See All in Research
機械学習で作った ポケモン対戦bot で 遊ぼう!
fufufukakaka
0
100
言語モデルから言語について語る際に押さえておきたいこと
eumesy
PRO
5
1.9k
社内データ分析AIエージェントを できるだけ使いやすくする工夫
fufufukakaka
1
1k
ウェブ・ソーシャルメディア論文読み会 第36回: The Stepwise Deception: Simulating the Evolution from True News to Fake News with LLM Agents (EMNLP, 2025)
hkefka385
0
210
2026.01ウェビナー資料
elith
0
330
第二言語習得研究における 明示的・暗示的知識の再検討:この分類は何に役に立つか,何に役に立たないか
tam07pb915
0
2.4k
HU Berlin: Industrial-Strength Natural Language Processing with spaCy and Prodigy
inesmontani
PRO
0
300
英語教育 “研究” のあり方:学術知とアウトリーチの緊張関係
terasawat
1
710
病院向け生成AIプロダクト開発の実践と課題
hagino3000
0
590
IEEE AIxVR 2026 Keynote Talk: "Beyond Visibility: Understanding Scenes and Humans under Challenging Conditions with Diverse Sensing"
miso2024
0
140
Can We Teach Logical Reasoning to LLMs? – An Approach Using Synthetic Corpora (AAAI 2026 bridge keynote)
morishtr
1
180
A History of Approximate Nearest Neighbor Search from an Applications Perspective
matsui_528
1
230
Featured
See All Featured
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
Joys of Absence: A Defence of Solitary Play
codingconduct
1
330
How to make the Groovebox
asonas
2
2.1k
How to Ace a Technical Interview
jacobian
281
24k
The Art of Programming - Codeland 2020
erikaheidi
57
14k
How GitHub (no longer) Works
holman
316
150k
VelocityConf: Rendering Performance Case Studies
addyosmani
333
24k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.6k
Are puppies a ranking factor?
jonoalderson
1
3.2k
Self-Hosted WebAssembly Runtime for Runtime-Neutral Checkpoint/Restore in Edge–Cloud Continuum
chikuwait
0
440
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
140
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Transcript
大規模リモートセンシングデータをもちいた土地 被覆分類 堤田 成政 京都大学 地球環境学堂
内容 大規模リモートセンシングデータをもちいた土地被覆分類 ◦ 1.データが大きいので・・・ ▪ DL→分析前処理までが大変 ▪ 分析が大変 ◦ 2.教師データの収集が大変(教師付き分類)
▪ なんだかんだいって教師データにすべてがかかっている ◦ 3.精度評価の辛み ▪ 精度評価は評価サンプルにすべてがかかっている ▪ 精度評価の辛み ▪ 空間精度評価の試み ▪ 誤差を含んだ分類図利用 ▪ ポリゴンデータの精度評価 ◦ まとめ:ふるくてあたらしい土地被覆分類研究
1.データが大きいので・・・ • DL→分析前処理までが大変 ◦ 使用データがオープンデータであればGoogle Earth Engine (GEE)
データが大きいので・・・ • 分析が大変 (Rを想定) ◦ nvblas (on nvidia GPU)を使う ◦ ラスターの使用RAMの上限を引き伸ばすrasterOptions(maxmemory
= 1e10) ◦ raster::clusterRを使う ◦ おそらくPythonでも一緒(numpy, rasterioまわりをいじる?) • これだけで数倍速! ◦ 個人的にはRもpythonも速度的には大した差がないのでは
分析例1(機械学習のためのGEE) • データ収集(AVHRR CDR. 1982-2016, Daily =(365.25×35=12783 mosaiced images), 5km
res.)(計約3.4TB分)) • 下処理 (QA処理、バンドごと平均・標準偏差(一年ごと)=(12バンド×35年) • 結果をGoogle Driveへ出力 (12 パラメータ×35年 = 約266MB/年 = 9.3GB)) • Google DriveからDL • RF + Logit・・・などで分析 (with nvblas, cluserR) • 注:単純な機械学習ならGEEで可
分析例2(統計モデルのためのGEE) • データ収集(MOD09GQ. 2001-2016, Daily =(365.25×16=5844 mosaiced images), 250m res.)
(計約1.5TB分)) • 下処理 (QA処理、Harmonic analysis(一年ごと)) • 結果をGoogle Driveへ出力 (4 パラメータ×16年 = 64 images (約250MB/image = 16GB)) • Google DriveからDL • bfastによる時系列分析 (with nvblas, cluserR)
2.教師データの収集が大変(教師付き分類) • なんだかんだいって教師データにすべてがかかっている ◦ よい教師データ→(モデル) →よい結果 ◦ 悪い教師データ→(どんなによいモデルでも)→わるい結果 • 教師データのオリジナリティがすべて ◦
分類クラス数・定義はデータ作成者次第 ◦ 分類図ユーザーの需要とマッチしない ▪ 誰のための分類図? • 自分で集める ◦ フィールドワーク ◦ Google Earth など • 教師データをシチズンサイエンスとして集める ◦ Geo-wiki ◦ SACLAJ など Geo-wiki. Fritz et al. (2017) in Scientific data SALCAJ
3. 精度評価の辛み • 精度評価は評価サンプルにすべてがかかっている ◦ 評価サンプルはランダムサンプリング?階層サンプリング? ◦ 精度評価は評価サンプルからの相対評価 ▪ 異なる評価サンプルによる精度評価は比較不能
▪ 評価サンプルの精度を検証すべき? ▪ 誤差は伝搬する • 精度評価の辛み ◦ 全体精度(Overall accuracy) ◦◦% = 全体誤差 100 - ◦◦% ◦ 精度(誤差)の空間的な偏り ▪ 空間データに適用した非空間分類モデルの誤差はランダムでない ▪ ランダムサンプリングされた評価サンプルをつかっても代表性があるとは限らない
誤差を含んだ分類図利用 • 誤差は伝搬する ◦ 土地被覆変化分析の怪(Post-classification comparison) ▪ 2時点比較(Post-classification comparison)はただしい? •
例:0.75×0.75≒0.56 ▪ 時系列評価サンプル収集は可能か? • 例:2000年ー2010年の土地被覆変化 ▪ 精度評価は評価サンプルからの相対評価 ◦ 2時点での評価サンプルがあれば変化マトリックスの作成が可能
ポリゴンデータの精度評価 • ポリゴンデータ精度評価はかなり難しい ◦ 作成したポリゴンと参照ポリゴンを比べて・・・ ▪ 面積の重複率? ▪ 外縁の長さ?(例:海岸線) ▪
角度ずれ?(例:パズル) Su and Zhang, ISPRS 2017
まとめ:ふるくてあたらしい土地被覆分類研究 • 衛星・ドローン画像を分類する ◦ 使用データを決める(解像度) ▪ 使用データがおおすぎて決めれない ◦ 分類クラスを決める ▪
おれさま分類図はニーズにあわない • 人によって定義はバラバラ ▪ ユーザーがほしい分類図とは? ◦ 教師サンプルをつくる ▪ 多様なクラス組み合わせが可能な教師サンプル をどうつくる? ◦ モデルを組む ▪ 適切なモデル? ◦ 精度分析する ▪ 適切な参照データ? ▪ 適切な精度分析? ▪ 精度のばらつき • それ以外で分類する ◦ OSM ◦ Mapillary ◦ VR?