Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ReverseGeo AIで画像から場所を特定する
Search
zawatti
July 29, 2025
Technology
0
190
ReverseGeo AIで画像から場所を特定する
zawatti
July 29, 2025
Tweet
Share
Other Decks in Technology
See All in Technology
Claude Code for NOT Programming
kawaguti
PRO
1
100
2026年、サーバーレスの現在地 -「制約と戦う技術」から「当たり前の実行基盤」へ- /serverless2026
slsops
2
270
生成AIを活用した音声文字起こしシステムの2つの構築パターンについて
miu_crescent
PRO
3
220
StrandsとNeptuneを使ってナレッジグラフを構築する
yakumo
1
130
10Xにおける品質保証活動の全体像と改善 #no_more_wait_for_test
nihonbuson
PRO
2
340
AWS DevOps Agent x ECS on Fargate検証 / AWS DevOps Agent x ECS on Fargate
kinunori
2
190
AIが実装する時代、人間は仕様と検証を設計する
gotalab555
1
510
マーケットプレイス版Oracle WebCenter Content For OCI
oracle4engineer
PRO
5
1.6k
[CV勉強会@関東 World Model 読み会] Orbis: Overcoming Challenges of Long-Horizon Prediction in Driving World Models (Mousakhan+, NeurIPS 2025)
abemii
0
150
猫でもわかるKiro CLI(セキュリティ編)
kentapapa
0
110
プロダクト成長を支える開発基盤とスケールに伴う課題
yuu26
4
1.4k
今日から始めるAmazon Bedrock AgentCore
har1101
4
420
Featured
See All Featured
The Power of CSS Pseudo Elements
geoffreycrofte
80
6.2k
Why Mistakes Are the Best Teachers: Turning Failure into a Pathway for Growth
auna
0
55
Speed Design
sergeychernyshev
33
1.5k
A Guide to Academic Writing Using Generative AI - A Workshop
ks91
PRO
0
210
Tips & Tricks on How to Get Your First Job In Tech
honzajavorek
0
440
Applied NLP in the Age of Generative AI
inesmontani
PRO
4
2.1k
Navigating Weather and Climate Data
rabernat
0
110
How to train your dragon (web standard)
notwaldorf
97
6.5k
Redefining SEO in the New Era of Traffic Generation
szymonslowik
1
220
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
231
22k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
250
Raft: Consensus for Rubyists
vanstee
141
7.3k
Transcript
ReverseGeo AIで画像から場所を特定する ザワッチ(@zawattizawawa) AIサービス開発者の会 #1 2025/07/29 1
目次 1. 自己紹介 2. ReverseGeoとは? 3. デモ 4. 技術スタック 5.
Gemini APIの活用方法 6. ユースケース 7. 今後の展望 8. AIをアプリ・サービスに組み込むときの考え方 9. まとめ 2
自己紹介 ザワッチ 株式会社ノベルワークス AIソリューション事業部 エンジニア LLM・Azureに興味がある クロスフィット・RustでOSを作ることにハマっている 3
ReverseGeoとは? 画像から場所(座標)を特定するAIアプリ 主な機能 画像アップロード/カメラ撮影から位置情報を推 定 複数のAI分析モードで精度向上 インタラクティブな3Dマップ表示 パフォーマンス 解析時間: 2-5秒
精度: 観光地・ランドマークで高精度 4
処理フロー 1. 画像入力 → カメラ撮影 or アップロード 2. Gemini APIを使用したAI分析
→ 画像内容の分析 3. 座標特定 → 緯度・経度の決定 4. 2D/3Dマップ表示 → マップ上のピンで確認 精度向上の工夫 複数の情報源を組み合わせ 信頼度スコアの算出 5
デモ 6
0:00 / 1:03 7
技術スタック フロントエンド Next.js + TypeScript Material-UI (MUI) + Tailwind CSS
Google Maps JavaScript API (3D対応) バックエンド/AI Google Gemini 2.5 Flash API Google Cloud Vision API 8
Google Web Groundingの流れ 🧠 判断 検索の必要性 → 🔍 生成 検索クエリ
→ 🌐 検索 Web情報収集 → 📝 合成 最終回答生成 9
Google Web Grounding 対応モデル Google検索によるグラウンディングは、Gemini 2.5 Pro、2.5 Flash、2.0 Flash、1.5 Pro、1.5
Flashの各モデルでサポート 参考: Google Gemini API - Google Search 10
Gemini APIの活用方法 11
①標準分析 const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }) const result
= await model.generateContent( [prompt, imagePart] // ← マルチモーダル推論 ) シンプルな推論で2-3秒、最小限のトークン使用 12
②高精度解析 const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash", tools: [{ googleSearch:
{} }] // ← function_callingで設定する }) const result = await model.generateContent([ prompt, imagePart ]) 複数情報源から検証し、曖昧な場所も特定可能。しかし、10秒ほどかかる GeminiがWeb検索もしない可能性もある 13
③類似画像検索 Google Cloud Vision API + Geminiで類似画像検索と詳細分析 const [result] =
await visionClient.webDetection({ image: { content: Buffer.from(image, 'base64') } }) const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }) const enhanced = await model.generateContent([ promptWithVisionData, imagePart ]) 14
ユースケース 旅行写真の整理: 撮影場所の自動タグ付け 不動産: 物件写真から正確な位置特定 観光案内: ランドマーク情報の提供 教育: 地理学習の補助ツール 15
今後の展望 座標を特定する仕組みをさらにエージェンティックにする 確度に応じて次に選択する行動を自律的に決定させる エッジ推論 ネットワーク依存からの脱却 Googleが最近出したgemma-3n-E2Bに熱視線 16
AIをアプリ・サービスに組み込むときの考え方 17
モデルの進化に応じてアプリ・サービスの質も向上していく設計 AIの進化は不可逆性 モデルの進化 → できないことができる → 新機能 18
LLMの入出力データのポリシー Azureでは... Azure OpenAI Servicesに悪用していないかを監視する仕組みがある Azure OpenAI サービスのデータ、プライバシー、セキュリティ → Azure
OpenAI Service 基盤モデルのトレーニング、再トレーニング、または 改善には使用されない きちんとドキュメント・利用規約を確認する必要がある 19
マルチエージェントよりもシングルエージェント 難しい点: エージェント間のトランザクション管理が複雑 エージェント間の接続数の増加により、処理が落ちることもある エージェントの呼び出しの最大数見極め → シングルエージェント+コンテキストエンジニアリングで頑張る 20
まとめ Google Gemini APIを使って高精度な画像分析アプリが作れる エッジ推論に期待 もう少しユースケースが出てくるまではシングルエージェントで頑張る 21
Thank you! ReverseGeo - AIで画像から場所を特定する 22