Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ReverseGeo AIで画像から場所を特定する
Search
zawatti
July 29, 2025
Technology
0
190
ReverseGeo AIで画像から場所を特定する
zawatti
July 29, 2025
Tweet
Share
Other Decks in Technology
See All in Technology
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
3
230
今日から始めるAmazon Bedrock AgentCore
har1101
4
420
旅先で iPad + Neovim で iOS 開発・執筆した話
zozotech
PRO
0
100
(技術的には)社内システムもOKなブラウザエージェントを作ってみた!
har1101
0
330
データの整合性を保ちたいだけなんだ
shoheimitani
8
3.2k
AzureでのIaC - Bicep? Terraform? それ早く言ってよ会議
torumakabe
1
620
Cloud Runでコロプラが挑む 生成AI×ゲーム『神魔狩りのツクヨミ』の裏側
colopl
0
150
Agent Skils
dip_tech
PRO
0
140
[CV勉強会@関東 World Model 読み会] Orbis: Overcoming Challenges of Long-Horizon Prediction in Driving World Models (Mousakhan+, NeurIPS 2025)
abemii
0
150
Bill One急成長の舞台裏 開発組織が直面した失敗と教訓
sansantech
PRO
2
410
私たち準委任PdEは2つのプロダクトに挑戦する ~ソフトウェア、開発支援という”二重”のプロダクトエンジニアリングの実践~ / 20260212 Naoki Takahashi
shift_evolve
PRO
2
210
プロポーザルに込める段取り八分
shoheimitani
1
670
Featured
See All Featured
ReactJS: Keep Simple. Everything can be a component!
pedronauck
666
130k
Design and Strategy: How to Deal with People Who Don’t "Get" Design
morganepeng
133
19k
How to Think Like a Performance Engineer
csswizardry
28
2.5k
Pawsitive SEO: Lessons from My Dog (and Many Mistakes) on Thriving as a Consultant in the Age of AI
davidcarrasco
0
68
Practical Orchestrator
shlominoach
191
11k
What Being in a Rock Band Can Teach Us About Real World SEO
427marketing
0
180
Ethics towards AI in product and experience design
skipperchong
2
200
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1k
The Pragmatic Product Professional
lauravandoore
37
7.1k
So, you think you're a good person
axbom
PRO
2
1.9k
A designer walks into a library…
pauljervisheath
210
24k
Avoiding the “Bad Training, Faster” Trap in the Age of AI
tmiket
0
79
Transcript
ReverseGeo AIで画像から場所を特定する ザワッチ(@zawattizawawa) AIサービス開発者の会 #1 2025/07/29 1
目次 1. 自己紹介 2. ReverseGeoとは? 3. デモ 4. 技術スタック 5.
Gemini APIの活用方法 6. ユースケース 7. 今後の展望 8. AIをアプリ・サービスに組み込むときの考え方 9. まとめ 2
自己紹介 ザワッチ 株式会社ノベルワークス AIソリューション事業部 エンジニア LLM・Azureに興味がある クロスフィット・RustでOSを作ることにハマっている 3
ReverseGeoとは? 画像から場所(座標)を特定するAIアプリ 主な機能 画像アップロード/カメラ撮影から位置情報を推 定 複数のAI分析モードで精度向上 インタラクティブな3Dマップ表示 パフォーマンス 解析時間: 2-5秒
精度: 観光地・ランドマークで高精度 4
処理フロー 1. 画像入力 → カメラ撮影 or アップロード 2. Gemini APIを使用したAI分析
→ 画像内容の分析 3. 座標特定 → 緯度・経度の決定 4. 2D/3Dマップ表示 → マップ上のピンで確認 精度向上の工夫 複数の情報源を組み合わせ 信頼度スコアの算出 5
デモ 6
0:00 / 1:03 7
技術スタック フロントエンド Next.js + TypeScript Material-UI (MUI) + Tailwind CSS
Google Maps JavaScript API (3D対応) バックエンド/AI Google Gemini 2.5 Flash API Google Cloud Vision API 8
Google Web Groundingの流れ 🧠 判断 検索の必要性 → 🔍 生成 検索クエリ
→ 🌐 検索 Web情報収集 → 📝 合成 最終回答生成 9
Google Web Grounding 対応モデル Google検索によるグラウンディングは、Gemini 2.5 Pro、2.5 Flash、2.0 Flash、1.5 Pro、1.5
Flashの各モデルでサポート 参考: Google Gemini API - Google Search 10
Gemini APIの活用方法 11
①標準分析 const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }) const result
= await model.generateContent( [prompt, imagePart] // ← マルチモーダル推論 ) シンプルな推論で2-3秒、最小限のトークン使用 12
②高精度解析 const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash", tools: [{ googleSearch:
{} }] // ← function_callingで設定する }) const result = await model.generateContent([ prompt, imagePart ]) 複数情報源から検証し、曖昧な場所も特定可能。しかし、10秒ほどかかる GeminiがWeb検索もしない可能性もある 13
③類似画像検索 Google Cloud Vision API + Geminiで類似画像検索と詳細分析 const [result] =
await visionClient.webDetection({ image: { content: Buffer.from(image, 'base64') } }) const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }) const enhanced = await model.generateContent([ promptWithVisionData, imagePart ]) 14
ユースケース 旅行写真の整理: 撮影場所の自動タグ付け 不動産: 物件写真から正確な位置特定 観光案内: ランドマーク情報の提供 教育: 地理学習の補助ツール 15
今後の展望 座標を特定する仕組みをさらにエージェンティックにする 確度に応じて次に選択する行動を自律的に決定させる エッジ推論 ネットワーク依存からの脱却 Googleが最近出したgemma-3n-E2Bに熱視線 16
AIをアプリ・サービスに組み込むときの考え方 17
モデルの進化に応じてアプリ・サービスの質も向上していく設計 AIの進化は不可逆性 モデルの進化 → できないことができる → 新機能 18
LLMの入出力データのポリシー Azureでは... Azure OpenAI Servicesに悪用していないかを監視する仕組みがある Azure OpenAI サービスのデータ、プライバシー、セキュリティ → Azure
OpenAI Service 基盤モデルのトレーニング、再トレーニング、または 改善には使用されない きちんとドキュメント・利用規約を確認する必要がある 19
マルチエージェントよりもシングルエージェント 難しい点: エージェント間のトランザクション管理が複雑 エージェント間の接続数の増加により、処理が落ちることもある エージェントの呼び出しの最大数見極め → シングルエージェント+コンテキストエンジニアリングで頑張る 20
まとめ Google Gemini APIを使って高精度な画像分析アプリが作れる エッジ推論に期待 もう少しユースケースが出てくるまではシングルエージェントで頑張る 21
Thank you! ReverseGeo - AIで画像から場所を特定する 22