Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ReverseGeo AIで画像から場所を特定する
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
zawatti
July 29, 2025
Technology
0
220
ReverseGeo AIで画像から場所を特定する
zawatti
July 29, 2025
Tweet
Share
Other Decks in Technology
See All in Technology
AWS DevOps Agent vs SRE俺 / AWS DevOps Agent vs me, the SRE
sms_tech
2
250
新職業『オーケストレーター』誕生 — エージェント10体を同時に回すAgentOps
gunta
4
1.6k
GitLab Duo Agent Platform + Local LLMサービングで幸せになりたい
jyoshise
0
170
「ストレッチゾーンに挑戦し続ける」ことって難しくないですか? メンバーの持続的成長を支えるEMの環境設計
sansantech
PRO
3
360
元エンジニアPdM、IDEが恋しすぎてCursorに全業務を集約したら、スライド作成まで爆速になった話
doiko123
1
410
LLM のプロダクト導入における開発の裏側と技術的挑戦
recruitengineers
PRO
1
120
マネージャー版 "提案のレベル" を上げる
konifar
21
13k
Kaggleの経験が実務にどう活きているか / kaggle_findy
sansan_randd
6
950
Sansan Engineering Unit 紹介資料
sansan33
PRO
1
4k
まなび領域における生成AI活用事例
recruitengineers
PRO
2
100
「ヒットする」+「近い」を同時にかなえるスマートサジェストの作り方.pdf
nakasho
0
140
聲の形にみるアクセシビリティ
tomokusaba
0
120
Featured
See All Featured
Amusing Abliteration
ianozsvald
0
120
Agile Actions for Facilitating Distributed Teams - ADO2019
mkilby
0
140
Navigating Team Friction
lara
192
16k
The Cost Of JavaScript in 2023
addyosmani
55
9.7k
Bash Introduction
62gerente
615
210k
Game over? The fight for quality and originality in the time of robots
wayneb77
1
130
Into the Great Unknown - MozCon
thekraken
40
2.3k
WENDY [Excerpt]
tessaabrams
9
36k
Java REST API Framework Comparison - PWX 2021
mraible
34
9.2k
Visualization
eitanlees
150
17k
Save Time (by Creating Custom Rails Generators)
garrettdimon
PRO
32
2.4k
Stewardship and Sustainability of Urban and Community Forests
pwiseman
0
130
Transcript
ReverseGeo AIで画像から場所を特定する ザワッチ(@zawattizawawa) AIサービス開発者の会 #1 2025/07/29 1
目次 1. 自己紹介 2. ReverseGeoとは? 3. デモ 4. 技術スタック 5.
Gemini APIの活用方法 6. ユースケース 7. 今後の展望 8. AIをアプリ・サービスに組み込むときの考え方 9. まとめ 2
自己紹介 ザワッチ 株式会社ノベルワークス AIソリューション事業部 エンジニア LLM・Azureに興味がある クロスフィット・RustでOSを作ることにハマっている 3
ReverseGeoとは? 画像から場所(座標)を特定するAIアプリ 主な機能 画像アップロード/カメラ撮影から位置情報を推 定 複数のAI分析モードで精度向上 インタラクティブな3Dマップ表示 パフォーマンス 解析時間: 2-5秒
精度: 観光地・ランドマークで高精度 4
処理フロー 1. 画像入力 → カメラ撮影 or アップロード 2. Gemini APIを使用したAI分析
→ 画像内容の分析 3. 座標特定 → 緯度・経度の決定 4. 2D/3Dマップ表示 → マップ上のピンで確認 精度向上の工夫 複数の情報源を組み合わせ 信頼度スコアの算出 5
デモ 6
0:00 / 1:03 7
技術スタック フロントエンド Next.js + TypeScript Material-UI (MUI) + Tailwind CSS
Google Maps JavaScript API (3D対応) バックエンド/AI Google Gemini 2.5 Flash API Google Cloud Vision API 8
Google Web Groundingの流れ 🧠 判断 検索の必要性 → 🔍 生成 検索クエリ
→ 🌐 検索 Web情報収集 → 📝 合成 最終回答生成 9
Google Web Grounding 対応モデル Google検索によるグラウンディングは、Gemini 2.5 Pro、2.5 Flash、2.0 Flash、1.5 Pro、1.5
Flashの各モデルでサポート 参考: Google Gemini API - Google Search 10
Gemini APIの活用方法 11
①標準分析 const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }) const result
= await model.generateContent( [prompt, imagePart] // ← マルチモーダル推論 ) シンプルな推論で2-3秒、最小限のトークン使用 12
②高精度解析 const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash", tools: [{ googleSearch:
{} }] // ← function_callingで設定する }) const result = await model.generateContent([ prompt, imagePart ]) 複数情報源から検証し、曖昧な場所も特定可能。しかし、10秒ほどかかる GeminiがWeb検索もしない可能性もある 13
③類似画像検索 Google Cloud Vision API + Geminiで類似画像検索と詳細分析 const [result] =
await visionClient.webDetection({ image: { content: Buffer.from(image, 'base64') } }) const model = genAI.getGenerativeModel({ model: "gemini-2.5-flash" }) const enhanced = await model.generateContent([ promptWithVisionData, imagePart ]) 14
ユースケース 旅行写真の整理: 撮影場所の自動タグ付け 不動産: 物件写真から正確な位置特定 観光案内: ランドマーク情報の提供 教育: 地理学習の補助ツール 15
今後の展望 座標を特定する仕組みをさらにエージェンティックにする 確度に応じて次に選択する行動を自律的に決定させる エッジ推論 ネットワーク依存からの脱却 Googleが最近出したgemma-3n-E2Bに熱視線 16
AIをアプリ・サービスに組み込むときの考え方 17
モデルの進化に応じてアプリ・サービスの質も向上していく設計 AIの進化は不可逆性 モデルの進化 → できないことができる → 新機能 18
LLMの入出力データのポリシー Azureでは... Azure OpenAI Servicesに悪用していないかを監視する仕組みがある Azure OpenAI サービスのデータ、プライバシー、セキュリティ → Azure
OpenAI Service 基盤モデルのトレーニング、再トレーニング、または 改善には使用されない きちんとドキュメント・利用規約を確認する必要がある 19
マルチエージェントよりもシングルエージェント 難しい点: エージェント間のトランザクション管理が複雑 エージェント間の接続数の増加により、処理が落ちることもある エージェントの呼び出しの最大数見極め → シングルエージェント+コンテキストエンジニアリングで頑張る 20
まとめ Google Gemini APIを使って高精度な画像分析アプリが作れる エッジ推論に期待 もう少しユースケースが出てくるまではシングルエージェントで頑張る 21
Thank you! ReverseGeo - AIで画像から場所を特定する 22