Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20230725_LT_画像解析機能でクイズを解かせたい
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NobuakiOshiro
PRO
July 25, 2023
Technology
2.9k
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20230725_LT_画像解析機能でクイズを解かせたい
https://omoshiroai.connpass.com/event/289172/
NobuakiOshiro
PRO
July 25, 2023
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260604_福岡女子大_講義後小レポート分析スライド_NOBDATA
doradora09
PRO
0
20
20260601_中東情勢1週間差分update
doradora09
PRO
0
33
20260602_中東情勢と物流_3か月振り返り_10枚圧縮版_最新版
doradora09
PRO
0
40
伊藤さん_発表スライド_全業種x各国_20260602
doradora09
PRO
1
34
20260528_生成AIを専属DSに_Howの次にすべきことを考える
doradora09
PRO
0
290
20260527_準悲観シナリオ_v2_価格高騰見込み
doradora09
PRO
0
59
20260527_ホルムズ制約長期化シナリオ(準悲観シナリオ)
doradora09
PRO
0
60
20260527_先週差分_今後調査予定_サマリ
doradora09
PRO
0
52
20260519_NOBDATA_企業決算から読む中東情勢
doradora09
PRO
0
67
Other Decks in Technology
See All in Technology
OCI Oracle AI Database Services新機能アップデート(2026/03-2026/05)
oracle4engineer
PRO
0
220
価格.comをAI駆動で全面刷新する ー 30年分の技術的負債を返し、次の30年の土台をつくる ー / AI Engineering Summit Tokyo 2026
tkyowa
49
52k
AI駆動開発が変える、大規模開発の前提 ーHuman in the Loop から Human on the Loop へ / AIE2026
visional_engineering_and_design
7
4.8k
サプライチェーンセキュリティの空白地帯 - 信頼できる”依存性”の未来を考える
rung
PRO
2
700
個人最適 から 全体最適 へ AI情報共有会・AIギルド・AI-DLC で進める カンリーの組織展開
rfdnxbro
0
1.5k
AIプラットフォームを運用し続けるための可観測性
tanimuyk
4
1.1k
Oracle AI Database@Azure:サービス概要のご紹介
oracle4engineer
PRO
6
1.9k
「気づいたら仕事が終わっている」バクラクAIエージェント本番運用の裏側 / layerx-bakuraku-aie2026
yuya4
18
10k
もりもり新機能を一挙紹介! AgentCoreに入門して、AWS上にAIエージェントを構築しよう
minorun365
PRO
6
800
AI Adaptable なテストを整える工夫 / Ways to Make Your Tests AI-Adaptable
bitkey
PRO
3
210
DevOps Agentで始めるAWS運用 〜フロンティアエージェントが変える運用の現場〜
nyankotaro
1
220
AIを「創る」と「使う」の循環 — HRテックが実践するリアルなAI組織実装
taketo957
0
1.5k
Featured
See All Featured
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
160
Scaling GitHub
holman
464
140k
Building a A Zero-Code AI SEO Workflow
portentint
PRO
0
550
Effective software design: The role of men in debugging patriarchy in IT @ Voxxed Days AMS
baasie
0
390
Lightning Talk: Beautiful Slides for Beginners
inesmontani
PRO
2
570
Git: the NoSQL Database
bkeepers
PRO
432
67k
The Power of CSS Pseudo Elements
geoffreycrofte
82
6.3k
A designer walks into a library…
pauljervisheath
211
24k
Faster Mobile Websites
deanohume
310
31k
How STYLIGHT went responsive
nonsquared
100
6.2k
The Straight Up "How To Draw Better" Workshop
denniskardys
239
140k
Visualizing Your Data: Incorporating Mongo into Loggly Infrastructure
mongodb
49
10k
Transcript
LT : 画像解析機能で クイズを解かせたい 2023/7/25 @doradora09
Copyright © 2023 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter
@doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会 九州⽀部 委員⻑ ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・過去 ・Tokyo.R(2010-2016) ・現在 ・fukuoka.R、PyData.Fukuoka、 意思決定のためのデータ分析勉強会、 データ分析系勉強会サテライトビューイング、 オモシロAIごった煮勉強会、ChatGPT部 勉強会の主催者です
画像解析機能がリリースされました • Google Bard (英語版のみ) • Bing Chat (notエンタープライズ版)
⾊々と触ってみた際の記事 • カウント系の精度はまだまだなものの、ざっくりとした解釈は いけそう https://note.com/chatgpt_nobdata/n/n82b871e0d706 https://note.com/chatgpt_nobdata/n/na9bbf6ab693e
今回のお題 • 画像解析機能を使ってクイズを解かせる
今回のお題 • 画像解析機能を使ってクイズを解かせる => 結論から⾔うと、まだまだ難しそう
①クロスワードパズル 参考: https://apprev.smt.docomo.ne.jp/noutore/article/1457670/ ・定番ですね ・何が⼊るかわかりますか・・?
①クロスワードパズル • Bard -> 頑張ってはいるが、 そもそもの⽂字認識がNG • Bing Chat ->
全然ダメ (3⽂字の問題と認識しない) 画像のクイズの答えは「き」です。 クロスワードパズルの最初の単語は「けい」で、「政府」 を意味します。2番⽬の単語は「う」で、ひらがな1⽂字 でそれ⾃体には何の意味もない。3番⽬の単語は「に」 で、「中」を意味する。 つの単語を作るために空欄に⼊れることができるひらがな は「き」だけである。最初の単語は「冷たい」を意味する 「きい」となる。2番⽬の単語は「きん」。 よって、クイズの答えは「き」。
①クロスワード パズル • Bard -> 頑張ってはいる が、 そもそもの⽂字認識 がNG •
Bing Chat -> 全然ダメ
①クロスワード パズル • 早々に諦め、 ChatGPT-4に頑張っ てもらう • テキストで⼊れる と、惜しいところま では⾏く
①クロスワード パズル • 3⽂字指定しても微妙
①クロスワード パズル • 総当たりで考えてもらう -> 惜しいがダメ
①クロスワード パズル • 濁⾳のヒントを与える -> いけました・・!! • 怪我に、ではなくて実際 は「⽑ガニ」
参考: ②間違い探し • ⾃信満々で答える ものの、全部違う (Bard) • 問題⾃体はちゃん と読んでる (8つの間違いを⽰
してね、とのこと)
参考: ②間違い探し • Bard答えを⽇本語 化するとこんな感 じ • ただ、いずれも異 なる https://tenhoo.jp/p/difference/
確かに、ここに2台のトラックの8つの違いがある: • トラックの⾞輪の数。左のトラックは6輪、右のトラックは4輪。 • トラックの⾊。左のトラックは⽩、右のトラックは⾚。 • ドアの位置。左のドアはトラックの左側にあり、右のドアはトラック の右側にあります。 • トラックに乗っている⼈数。左のトラックには2⼈、右のトラックに は1⼈しか乗っていない。 • 餃⼦の鍋の位置。左の餃⼦鍋はトラックの荷台にあり、右の餃⼦鍋は トラックの⼿前にある。 • 餃⼦の鍋の⾊。左の餃⼦鍋は⾚、右の餃⼦鍋は⽩。 • 鍋の中の餃⼦の数。左の鍋には6個、右の鍋には4個の餃⼦が⼊って いる。 • 箸の位置。左の箸は餃⼦の鍋の中にあり、右の箸はトラックの横の地 ⾯にある。 参考になれば幸いだ!
参考: ②間違い探し • 答えこんな感じ https://tenhoo.jp/p/difference/
参考: ③ウォーリー探し • これもNG • ウォーリーの問題で す、というところま では認識してますが 細かい部分はまだま だ苦⼿な模様
https://www.atpress.ne.jp/news/192236
参考: ③ウォーリー探し • これもNG • 該当箇所をクロッピ ングしてもなかなか 認めてくれない・・ https://www.atpress.ne.jp/news/192236
まとめ • 画像認識単体ではまだまだクイズを解かせるのは難しそう • 総当たりなどを指⽰すれば、クロスワードは解けるケースもあ る(ある種のヒントの提⽰) • 今後の画像認識精度の向上に期待
Enjoy .. !!