20231021_LT_画像解析AI３種比較(10min版)

画像解析AI ３種⽐較〜 Google Bard, MS Bing Chat, OpenAI GPT-4V
〜 (10min版) 2023/10/21 NOB DATA株式会社代表取締役⼤城信晃

Copyright © 2023 NOB DATA All Rights Reserved. ⾃⼰紹介⼤城信晃(twitter
@doradora09) NOB DATA株式会社代表取締役社⻑ / データサイエンティスト協会九州⽀部⽀部⻑・住まい沖縄 -> 東京 -> 福岡・職歴ヤフー-> DATUM STUDIO -> LINE Fukuoka -> NOB DATA(株) 創業・運営コミュニティ・Tokyo.R(2010-2016) ・fukuoka.R、PyData.Fukuoka、オモシロAIごった煮勉強会、ChatGPT部、他２つ ChatGPT部では部⻑をやってます NEW: 11/11発売

Copyright © 2023 NOB DATA All Rights Reserved. 本⽇のお品書き •
GPT-4Vと他の画像解析AIの性能⽐較 • 過去に調査した内容をベースに本⽇はお届け https://note.com/chatgpt_nobdat a/n/na9bbf6ab693e https://note.com/chatgpt_nobda ta/n/n82b871e0d706 https://note.com/chatgpt_no bdata/n/n998ed3dc285b

Copyright © 2023 NOB DATA All Rights Reserved. 今回の性能検証に使った画像検証⽤画像
• ⼤城写真 • ⽣成AIで作った渋滞画像 • アスキーアートのクリスマスツリー • 某ハンバーガーショップのメニュー画像 • トマト画像これらを３つのAIに⼊れた場合の反応を⽐較します ( 検証⽇付時点の結果 )

Copyright © 2023 NOB DATA All Rights Reserved. ① ⼤城画像
(点数は主観) (1/3) ⼈物画像は解析NG、０点 (というか判定できず) 70点くらい (ビールガーデンではなくワインのイベント) 80点くらい。状況は理解しているが、⽇本語認識は弱い印象(Google Vision API の⽅が読めてた)

(点数は主観) (2/3) ・今回の⽐較には載せていないものの、GoogleのVision APIだとOCR精度は⾼い印象 (Bardとはまた別の画像解析機能) https://note.com/chatgpt_nobdata/n/ne54 2f2011f87

(点数は主観) (3/3) ・ChatGPT-4Vと⾔えども、ハルシネーションは発⽣し得るので注意 (写真の場所は福岡なのに、軽井沢とか急に⾔い出すことも・・)

Copyright © 2023 NOB DATA All Rights Reserved. ② ハンバーガー画像
(点数は主観) たまに⾦額は間違うものの、⼤体合ってる。７０点商品名も価格も全然正しくない。１５点品⽬、⾦額完璧。さらに MacCafeでは、という推測まで。１２０点

Copyright © 2023 NOB DATA All Rights Reserved. ③ アスキーアート画像
(点数は主観) (1/2) クリスマスツリーっぽい回答。カウントは苦⼿なので６０点うーん、アスキーアートとして認識できていない。カウントもダメ。３０点ヒントを提⽰すれば理解できる。カウントも間違えているがBardよりは正確。７０点

Copyright © 2023 NOB DATA All Rights Reserved. クリスマスツリーっぽい回答。カウントは苦⼿なので
８０点うーん、アスキーアートとして認識できていない。カウントもダメ。３０点ヒントを提⽰すれば理解できる。カウントも間違えているがBardよりは正確。８０点 ③ アスキーアート画像 (点数は主観) (2/2)

Copyright © 2023 NOB DATA All Rights Reserved. 主観の点数評価ここまでをChatGPT-4で採点
(記事だと思いの外Bing Chatを過⼤評価してたかも・・？？カウント系が難易度⾼い ) いずれにせよ、GPT-4Vは頭2つくらい⾶び抜けてる印象でした

Copyright © 2023 NOB DATA All Rights Reserved. ご清聴、ありがとうございました・・！何か個別のご相談やご質問がございましたら
[email protected] (NOB DATA問い合わせ窓⼝) までお気軽にどうぞ。

20231021_LT_画像解析AI３種比較(10min版)

20231021_LT_画像解析AI３種比較(10min版)

NobuakiOshiro PRO

More Decks by NobuakiOshiro

Other Decks in Technology

Featured

Transcript

画像解析AI ３種⽐較〜 Google Bard, MS Bing Chat, OpenAI GPT-4V

Copyright © 2023 NOB DATA All Rights Reserved. ⾃⼰紹介⼤城信晃(twitter

Copyright © 2023 NOB DATA All Rights Reserved. 本⽇のお品書き •

Copyright © 2023 NOB DATA All Rights Reserved. 今回の性能検証に使った画像検証⽤画像

Copyright © 2023 NOB DATA All Rights Reserved. ① ⼤城画像

Copyright © 2023 NOB DATA All Rights Reserved. ① ⼤城画像

Copyright © 2023 NOB DATA All Rights Reserved. ① ⼤城画像

Copyright © 2023 NOB DATA All Rights Reserved. ② ハンバーガー画像

Copyright © 2023 NOB DATA All Rights Reserved. ③ アスキーアート画像

Copyright © 2023 NOB DATA All Rights Reserved. クリスマスツリーっぽい回答。カウントは苦⼿なので

Copyright © 2023 NOB DATA All Rights Reserved. 渋滞は理解。歩いている⼈はいないので嘘。カウント

Copyright © 2023 NOB DATA All Rights Reserved. 情景描写としては結構いい。カウントは種類が嘘だが台

Copyright © 2023 NOB DATA All Rights Reserved. 情景描写としては結構いい。カウント12個は間違い。

Copyright © 2023 NOB DATA All Rights Reserved. 主観の点数評価ここまでをChatGPT-4で採点

Copyright © 2023 NOB DATA All Rights Reserved. ご清聴、ありがとうございました・・！何か個別のご相談やご質問がございましたら