Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
20231021_LT_画像解析AI3種比較(10min版)
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
NobuakiOshiro
PRO
October 21, 2023
Technology
210
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
20231021_LT_画像解析AI3種比較(10min版)
https://chatgptclub.connpass.com/event/298703/
NobuakiOshiro
PRO
October 21, 2023
More Decks by NobuakiOshiro
See All by NobuakiOshiro
20260604_福岡女子大_講義後小レポート分析スライド_NOBDATA
doradora09
PRO
0
20
20260601_中東情勢1週間差分update
doradora09
PRO
0
33
20260602_中東情勢と物流_3か月振り返り_10枚圧縮版_最新版
doradora09
PRO
0
40
伊藤さん_発表スライド_全業種x各国_20260602
doradora09
PRO
1
34
20260528_生成AIを専属DSに_Howの次にすべきことを考える
doradora09
PRO
0
290
20260527_準悲観シナリオ_v2_価格高騰見込み
doradora09
PRO
0
59
20260527_ホルムズ制約長期化シナリオ(準悲観シナリオ)
doradora09
PRO
0
60
20260527_先週差分_今後調査予定_サマリ
doradora09
PRO
0
52
20260519_NOBDATA_企業決算から読む中東情勢
doradora09
PRO
0
67
Other Decks in Technology
See All in Technology
新規ゲーム開発におけるAI駆動開発のリアル
202409e2
0
2.5k
もりもり新機能を一挙紹介! AgentCoreに入門して、AWS上にAIエージェントを構築しよう
minorun365
PRO
6
800
さきさん文庫の書籍ができるまで
sakiengineer
0
370
DevOps Agentで始めるAWS運用 〜フロンティアエージェントが変える運用の現場〜
nyankotaro
1
220
EventBridge Connection
_kensh
4
520
JEP 522 Deep Dive - G1 GC同期コスト削減によるスループット向上を徹底検証&解説
tabatad
1
850
個人の発見を、組織の知恵に 〜生成AI活用を"探索"から"組織の仕組み"へ〜
kintotechdev
2
980
Terraformモジュールは、なぜ「魔境」化するのか
hayama17
1
190
AI-DLCを活用した高品質・安全なAI駆動開発実践 / AI Driven Development
yoshidashingo
1
360
生成 AI × MCP で切り拓く次世代 SRE!自律型運用への挑戦と開発者体験の進化
_awache
0
150
LLMと共に進化するプロセスを目指して
ymatsuwitter
11
3k
AI活用を推進するために ファインディが下した、一つの小さな決断
starfish719
0
250
Featured
See All Featured
Kristin Tynski - Automating Marketing Tasks With AI
techseoconnect
PRO
0
270
The Language of Interfaces
destraynor
162
27k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
Speed Design
sergeychernyshev
33
1.8k
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
300
Digital Ethics as a Driver of Design Innovation
axbom
PRO
1
300
Heart Work Chapter 1 - Part 1
lfama
PRO
7
36k
Faster Mobile Websites
deanohume
310
31k
The browser strikes back
jonoalderson
0
1.1k
The Invisible Side of Design
smashingmag
302
52k
I Don’t Have Time: Getting Over the Fear to Launch Your Podcast
jcasabona
34
2.8k
Mind Mapping
helmedeiros
PRO
1
230
Transcript
画像解析AI 3種⽐較 〜 Google Bard, MS Bing Chat, OpenAI GPT-4V
〜 (10min版) 2023/10/21 NOB DATA株式会社 代表取締役 ⼤城 信晃
Copyright © 2023 NOB DATA All Rights Reserved. ⾃⼰紹介 ⼤城信晃(twitter
@doradora09) NOB DATA株式会社 代表取締役社⻑ / データサイエンティスト協会九州⽀部 ⽀部⻑ ・住まい 沖縄 -> 東京 -> 福岡 ・職歴 ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業 ・運営コミュニティ ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、 オモシロAIごった煮勉強会、ChatGPT部、 他2つ ChatGPT部では部⻑をやってます NEW: 11/11発売
Copyright © 2023 NOB DATA All Rights Reserved. 本⽇のお品書き •
GPT-4Vと他の画像解析AIの性能⽐較 • 過去に調査した内容をベースに本⽇はお届け https://note.com/chatgpt_nobdat a/n/na9bbf6ab693e https://note.com/chatgpt_nobda ta/n/n82b871e0d706 https://note.com/chatgpt_no bdata/n/n998ed3dc285b
Copyright © 2023 NOB DATA All Rights Reserved. 今回の性能検証に使った画像 検証⽤画像
• ⼤城写真 • ⽣成AIで作った渋滞画像 • アスキーアートのクリス マスツリー • 某ハンバーガーショップ のメニュー画像 • トマト画像 これらを3つのAIに⼊れた 場合の反応を⽐較します ( 検証⽇付時点の結果 )
Copyright © 2023 NOB DATA All Rights Reserved. ① ⼤城画像
(点数は主観) (1/3) ⼈物画像は解析NG、0点 (というか判定できず) 70点くらい (ビールガーデンではなく ワインのイベント) 80点くらい。状況は理解し ているが、⽇本語認識は弱 い印象(Google Vision API の⽅が読めてた)
Copyright © 2023 NOB DATA All Rights Reserved. ① ⼤城画像
(点数は主観) (2/3) ・今回の⽐較には載せていないものの、GoogleのVision APIだとOCR精度は⾼い印象 (Bardとはまた別の画像解析機能) https://note.com/chatgpt_nobdata/n/ne54 2f2011f87
Copyright © 2023 NOB DATA All Rights Reserved. ① ⼤城画像
(点数は主観) (3/3) ・ChatGPT-4Vと⾔えども、ハルシネーションは発⽣し得るので注意 (写真の場所は福岡なのに、軽井沢とか急に⾔い出すことも・・)
Copyright © 2023 NOB DATA All Rights Reserved. ② ハンバーガー画像
(点数は主観) たまに⾦額は間違うものの、 ⼤体合ってる。70点 商品名も価格も 全然正しくない。15点 品⽬、⾦額完璧。さらに MacCafeでは、という推測 まで。120点
Copyright © 2023 NOB DATA All Rights Reserved. ③ アスキーアート画像
(点数は主観) (1/2) クリスマスツリーっぽい回 答。カウントは苦⼿なので 60点 うーん、アスキーアートと して認識できていない。カ ウントもダメ。 30点 ヒントを提⽰すれば理解で きる。カウントも間違えて いるがBardよりは正確。 70点
Copyright © 2023 NOB DATA All Rights Reserved. クリスマスツリーっぽい回 答。カウントは苦⼿なので
80点 うーん、アスキーアートと して認識できていない。カ ウントもダメ。 30点 ヒントを提⽰すれば理解で きる。カウントも間違えて いるがBardよりは正確。 80点 ③ アスキーアート画像 (点数は主観) (2/2)
Copyright © 2023 NOB DATA All Rights Reserved. 渋滞は理解。歩いている⼈ はいないので嘘。カウント
は出来ていないので60点 ( 概算の指⽰をしても良 かったかも? ) 情景描写としては結構いい。 カウントは種類が嘘だが台 数は近い。80点 100点 ④ ⾃動⾞渋滞画像 (点数は主観) (1/2)
Copyright © 2023 NOB DATA All Rights Reserved. 情景描写としては結構いい。 カウントは種類が嘘だが台
数は近い。80点 100点 ④ ⾃動⾞渋滞画像 (点数は主観) (2/2) 渋滞は理解。歩いている⼈ はいないので嘘。カウント は出来ていないので60点 ( 概算の指⽰をしても良 かったかも? )
Copyright © 2023 NOB DATA All Rights Reserved. 情景描写としては結構いい。 カウント12個は間違い。
70点 トマトの描画、カウント完 璧。さらに後ろの壁からバ ルコニーを推察。 120点 ⑤ トマト画像 (点数は主観) トマトは認識しているのの、 個数10個は間違い、あと⻩ ⾊や緑のトマトはない。 40点
Copyright © 2023 NOB DATA All Rights Reserved. 主観の点数評価 ここまでをChatGPT-4で採点
(記事だと思いの外Bing Chatを 過⼤評価してたかも・・?? カウント系が難易度⾼い ) いずれにせよ、GPT-4Vは頭2つくらい ⾶び抜けてる印象でした
Copyright © 2023 NOB DATA All Rights Reserved. ご清聴、ありがとうございました・・! 何か個別のご相談やご質問がございましたら
[email protected]
(NOB DATA問い合わせ窓⼝) までお気軽にどうぞ。