Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
o1 pro mode の調査レポート
Search
smorce
January 04, 2025
Research
0
76
o1 pro mode の調査レポート
すべてAIで生成したスライドです。レイアウトはまだ調整中です。
smorce
January 04, 2025
Tweet
Share
More Decks by smorce
See All by smorce
SHAPやLIMEなどの説明AI(XAI)のご紹介 / SHAP LIME PDP Grad-CAM
smorce
7
5.1k
Other Decks in Research
See All in Research
2038年問題が思ったよりヤバい。検出ツールを作って脅威性評価してみた論文 | Kansai Open Forum 2024
ran350
8
3.7k
NeurIPS 2024 参加報告 & 論文紹介 (SACPO, Ctrl-G)
reisato12345
0
180
2024/10/30 産総研AIセミナー発表資料
keisuke198619
1
410
한국어 오픈소스 거대 언어 모델의 가능성: 새로운 시대의 언어 이해와 생성
inureyes
PRO
0
160
[ECCV2024読み会] 衛星画像からの地上画像生成
elith
1
990
Zipf 白色化:タイプとトークンの区別がもたらす良質な埋め込み空間と損失関数
eumesy
PRO
8
1.2k
論文紹介: COSMO: A Large-Scale E-commerce Common Sense Knowledge Generation and Serving System at Amazon (SIGMOD 2024)
ynakano
1
310
Tietovuoto Social Design Agency (SDA) -trollitehtaasta
hponka
0
3.3k
Weekly AI Agents News! 12月号 プロダクト/ニュースのアーカイブ
masatoto
0
250
20240918 交通くまもとーく 未来の鉄道網編(太田恒平)
trafficbrain
0
450
IM2024
mamoruk
0
200
博士学位論文予備審査 / Scaling Telemetry Workloads in Cloud Applications: Techniques for Instrumentation, Storage, and Mining
yuukit
1
1.6k
Featured
See All Featured
How to train your dragon (web standard)
notwaldorf
89
5.8k
The Illustrated Children's Guide to Kubernetes
chrisshort
48
49k
Fantastic passwords and where to find them - at NoRuKo
philnash
50
3k
Optimising Largest Contentful Paint
csswizardry
33
3k
Making Projects Easy
brettharned
116
6k
Side Projects
sachag
452
42k
Building Better People: How to give real-time feedback that sticks.
wjessup
366
19k
Building a Modern Day E-commerce SEO Strategy
aleyda
38
7.1k
The Invisible Side of Design
smashingmag
299
50k
Distributed Sagas: A Protocol for Coordinating Microservices
caitiem20
330
21k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
8
1.2k
VelocityConf: Rendering Performance Case Studies
addyosmani
327
24k
Transcript
目次(1/6) • 1. 概要 – 1.1. o1 pro modeの基本情報 –
1.2. 料金と利用条件 – 1.3. 開発背景と目的
目次(2/6) • 2. o1 pro modeの主要機能と特徴 – 2.1. 高度な推論能力 –
2.2. マルチモーダル対応 – 2.3. 高速・正確な応答システム – 2.4. 思考時間の最適化機能
目次(3/6) • 3. o1 pro modeの性能評価 – 3.1. 数学分野での性能 –
3.2. プログラミング分野での性能 – 3.3. 科学的問題解決能力 – 3.4. 信頼性と一貫性の分析
目次(4/6) • 4. o1 pro modeの利用対象者と活用分野 – 4.1. 研究者・エンジニア向け機能 –
4.2. プログラマー向け機能 – 4.3. データサイエンティスト向け機能
目次(5/6) • 5. o1 pro modeの従来モデルとの比較 – 5.1. o1との性能差 –
5.2. GPT-4oとの違い – 5.3. 処理速度と精度の比較
目次(6/6) • 6. o1 pro modeの今後の展望 – 6.1. APIの可能性 –
6.2. 将来の開発方向性 – 6.3. 産業への影響
1. 概要
2. o1 pro modeの主要機能と特徴
3. o1 pro modeの性能評価
4. o1 pro modeの利用対象者と活用分野
5. o1 pro modeの従来モデルとの比較
6. o1 pro modeの今後の展望
1. 概要 • o1 pro modeの基本情報 – OpenAI開発の最新の推論モデル – 複雑な数学、科学、プログラミング問題に強い
– マルチモーダル対応(テキストと画像の同時解析) – 深い思考と高精度な回答を実現 – 従来モデルより高速化、誤答率削減 • 料金と利用条件 – ChatGPT Proプラン加入が必要(月額200ドル/約3 万円) – 通常のo1モデルはChatGPT Plus(月額30ドル)で利 用可能 • 開発背景と目的 – 複雑な問題に対する深い分析と正確な解答を目指 30 200 0 50 100 150 200 250 ChatGPT Plus ChatGPT Pro ChatGPT プランと料金比較 ChatGPT Plus ChatGPT Pro
2. o1 pro modeの主要機能と特徴 • 高度な推論能力 – 複雑な問題への深い思考と信頼性の高い回答生成 能力 –
データサイエンス、プログラミング、法律分野で GPT-4oを上回る正確性と包括性を外部評価で実 証済 – 数学では最適な解法を選択、科学では最新知見に 基づく回答生成、プログラミングでは効率的なア ルゴリズムとバグのないコード生成が可能 • 高速・正確な応答システム – 質問の難易度に応じた思考時間調整で、GPT-4o より速度と精度のバランスを最適化 – o1-previewより高速な回答生成 – 高度なアルゴリズムによる効率的な思考時間調整 credit by Unsplash
3. o1 pro modeの性能評価 • 数学分野での性能 – o1 pro modeはAIME
2024で86%の正答率、o1は 78% – 精度はo1 pro modeが85.8%、o1が78.3% – 4回連続正解率はo1 pro modeが80%、o1が66.7% • プログラミング分野での性能 – o1 pro modeはCodeforcesで90パーセンタイル、 o1は89パーセンタイル – 信頼性パーセンタイルはo1 pro modeが74.9%、 o1が64.2% • 科学的問題解決能力 – o1 pro modeはGPQA Diamondで79%の正答率、 o1は76% 78 78.3 67 89 64.2 64 76 75.6 67 86 85.8 80 90 74.9 75 79 79.3 74 0 20 40 60 80 100 o1とo1 pro modeの性能比較 o1 o1 pro mode
4. o1 pro modeの利用対象者と活用分野 • 研究者・エンジニア向け機能 – 高度な推論能力による複雑な課題解決 – 大阪大学入試レベルの数学問題への対応
– 安定的なコード生成とバグ削減 – 大規模データセットや複雑なシミュレーションの 高速処理 – 高度なアルゴリズム設計とエラー修正 • プログラマー向け機能 – リアルタイムコード生成とエラー修正サポート – プロトタイプ開発の高速化 – 高度なアルゴリズム設計と並列処理プログラム作 成 – 安定したコード生成と高い信頼性 – 競技プログラミングでの高正解率 credit by Unsplash
5. o1 pro modeの従来モデルとの比較 • o1との性能差 – o1 pro modeは、より多くの計算リソースを活用
し、深い思考と高精度な回答を実現する。 – AIME 2024で86%、Codeforcesで90%の正解率を 記録し、o1を上回る。 – 数学、プログラミングなど様々な分野でo1を上回 る性能 • GPT-4oとの違い – 処理速度と精度のバランスが異なる。o1 pro modeは複雑な問題に強く、GPT-4oは処理速度が 速い。 – 研究論文分析や高度な計算にはo1 pro mode、日 常的なタスクにはGPT-4oが適している。 – o1はGPT-4oより思考連鎖の深さと精度で優れ、 命令階層により制御性と安全性が向上している。 86 90 78 89 70 75 80 85 90 95 AIME 2024 Codeforces o1 pro modeとo1の正解率比較 o1 pro mode o1
6. o1 pro modeの今後の展望 • APIの可能性 – o1 Pro ModeのAPI提供により、スタートアップ企
業はProレベルのAI機能を自社製品に組み込める 。 – 高品質なデータ解析やインテリジェントな提案が 可能になり、カスタマーサービスロボットの構築 も効率化される。 – ECプラットフォームは、自動生成されたコンテン ツで運用効率とコンバージョン率を向上できる。 – OpenAIは構造化出力、関数呼び出し、画像理解 APIなどの新機能を追加する計画。 – 中国の起業家は、新しいSaaSツールや海外市場向 けサービス構築に活用できる。 • 将来の開発方向性 – OpenAIはo1モデルとChatGPT Proの機能改善を 継続。ChatGPT Proはより長い時間、多くの処理 credit by Unsplash