Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ReverseGeo AIで画像から場所を特定する
Search
zawatti
July 29, 2025
Technology
320
0
Share
ReverseGeo AIで画像から場所を特定する
zawatti
July 29, 2025
Other Decks in Technology
See All in Technology
DevOpsDays Tokyo 2026 見えない開発現場を、見える投資に変える
rojoudotcom
3
200
プロンプトエンジニアリングを超えて:自由と統制のあいだでつくる Platform × Context Engineering
yuriemori
0
240
[最強DB講義]推薦システム | 基礎編
recsyslab
PRO
1
140
みんなで作るAWS Tips 100連発 (FinOps編)
schwrzktz
1
260
幾億の壁を超えて/Beyond Countless Walls(JP)
ikuodanaka
0
130
Code Interpreter で、AIに安全に コードを書かせる。
yokomachi
0
6.8k
Introduction to Sansan Meishi Maker Development Engineer
sansan33
PRO
0
390
[OpsJAWS 40]リリースしたら終わり、じゃなかった。セキュリティ空白期間をAWS Security Agentで埋める
sh_fk2
3
200
レビューしきれない?それは「全て人力でのレビュー」だからではないでしょうか
amixedcolor
0
250
QGISプラグイン CMChangeDetector
naokimuroki
1
320
Oracle AI Database@AWS:サービス概要のご紹介
oracle4engineer
PRO
4
2.3k
JOAI2026講評会資料(近藤佐介)
element138
1
150
Featured
See All Featured
From Legacy to Launchpad: Building Startup-Ready Communities
dugsong
0
190
The Psychology of Web Performance [Beyond Tellerrand 2023]
tammyeverts
49
3.4k
jQuery: Nuts, Bolts and Bling
dougneiner
66
8.4k
Scaling GitHub
holman
464
140k
Bootstrapping a Software Product
garrettdimon
PRO
307
120k
Claude Code のすすめ
schroneko
67
220k
The Curious Case for Waylosing
cassininazir
0
300
コードの90%をAIが書く世界で何が待っているのか / What awaits us in a world where 90% of the code is written by AI
rkaga
61
43k
Build your cross-platform service in a week with App Engine
jlugia
234
18k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
310
A Tale of Four Properties
chriscoyier
163
24k
Context Engineering - Making Every Token Count
addyosmani
9
820
Transcript
ReverseGeo AIで画像から場所を特定する ザワッチ(@zawattizawawa) AIサービス開発者の会 #1 2025/07/29 1
目次 1. 自己紹介 2. ReverseGeoとは? 3. デモ 4. 技術スタック 5.
Gemini APIの活用方法 6. ユースケース 7. 今後の展望 8. AIをアプリ・サービスに組み込むときの考え方 9. まとめ 2
自己紹介 ザワッチ 株式会社ノベルワークス AIソリューション事業部 エンジニア LLM・Azureに興味がある クロスフィット・RustでOSを作ることにハマっている 3
ReverseGeoとは? 画像から場所(座標)を特定するAIアプリ 主な機能 画像アップロード/カメラ撮影から位置情報を推 定 複数のAI分析モードで精度向上 インタラクティブな3Dマップ表示 パフォーマンス 解析時間: 2-5秒
精度: 観光地・ランドマークで高精度 4
処理フロー 1. 画像入力 → カメラ撮影 or アップロード 2. Gemini APIを使用したAI分析
→ 画像内容の分析 3. 座標特定 → 緯度・経度の決定 4. 2D/3Dマップ表示 → マップ上のピンで確認 精度向上の工夫 複数の情報源を組み合わせ 信頼度スコアの算出 5
デモ 6
0:00 / 1:03 7
技術スタック フロントエンド Next.js + TypeScript Material-UI (MUI) + Tailwind CSS
Google Maps JavaScript API (3D対応) バックエンド/AI Google Gemini 2.5 Flash API Google Cloud Vision API 8
Google Web Groundingの流れ 🧠 判断 検索の必要性 → 🔍 生成 検索クエリ
→ 🌐 検索 Web情報収集 → 📝 合成 最終回答生成 9
Google Web Grounding 対応モデル Google検索によるグラウンディングは、Gemini 2.5 Pro、2.5 Flash、2.0 Flash、1.5 Pro、1.5
Flashの各モデルでサポート 参考: Google Gemini API - Google Search 10
Gemini APIの活用方法 11
①標準分析 const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }) const result
= await model.generateContent( [prompt, imagePart] // ← マルチモーダル推論 ) シンプルな推論で2-3秒、最小限のトークン使用 12
②高精度解析 const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash", tools: [{ googleSearch:
{} }] // ← function_callingで設定する }) const result = await model.generateContent([ prompt, imagePart ]) 複数情報源から検証し、曖昧な場所も特定可能。しかし、10秒ほどかかる GeminiがWeb検索もしない可能性もある 13
③類似画像検索 Google Cloud Vision API + Geminiで類似画像検索と詳細分析 const [result] =
await visionClient.webDetection({ image: { content: Buffer.from(image, 'base64') } }) const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }) const enhanced = await model.generateContent([ promptWithVisionData, imagePart ]) 14
ユースケース 旅行写真の整理: 撮影場所の自動タグ付け 不動産: 物件写真から正確な位置特定 観光案内: ランドマーク情報の提供 教育: 地理学習の補助ツール 15
今後の展望 座標を特定する仕組みをさらにエージェンティックにする 確度に応じて次に選択する行動を自律的に決定させる エッジ推論 ネットワーク依存からの脱却 Googleが最近出したgemma-3n-E2Bに熱視線 16
AIをアプリ・サービスに組み込むときの考え方 17
モデルの進化に応じてアプリ・サービスの質も向上していく設計 AIの進化は不可逆性 モデルの進化 → できないことができる → 新機能 18
LLMの入出力データのポリシー Azureでは... Azure OpenAI Servicesに悪用していないかを監視する仕組みがある Azure OpenAI サービスのデータ、プライバシー、セキュリティ → Azure
OpenAI Service 基盤モデルのトレーニング、再トレーニング、または 改善には使用されない きちんとドキュメント・利用規約を確認する必要がある 19
マルチエージェントよりもシングルエージェント 難しい点: エージェント間のトランザクション管理が複雑 エージェント間の接続数の増加により、処理が落ちることもある エージェントの呼び出しの最大数見極め → シングルエージェント+コンテキストエンジニアリングで頑張る 20
まとめ Google Gemini APIを使って高精度な画像分析アプリが作れる エッジ推論に期待 もう少しユースケースが出てくるまではシングルエージェントで頑張る 21
Thank you! ReverseGeo - AIで画像から場所を特定する 22