Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
OpenAI o1-preview
Search
MARGO
September 21, 2024
Business
0
20
OpenAI o1-preview
MARGO
September 21, 2024
Tweet
Share
More Decks by MARGO
See All by MARGO
Shopifyピッチデッキ(和訳)
margoslide
0
4
Features of MARGO
margoslide
0
82
自民党総裁選2024
margoslide
0
22
MrBeast HOW TO SUCCEED IN MRBEAST PRODUCTION
margoslide
0
840
エヌビディア2024年第2クォーター決算
margoslide
0
13
Dodgers Roster
margoslide
0
8
Other Decks in Business
See All in Business
ブロックを用いた情報整理ゲーム「モンスタービルディング」
chibanba1982
PRO
0
1.2k
Sales Marker Culture book
salesmarker
PRO
10
28k
イークラウド会社紹介 ~ひとりひとりの想いをつなぎ、挑戦に力を~
ecrowd
1
2.4k
コンセンサスゲーム「砂漠からの脱出 オンライン版」
chibanba1982
PRO
0
550
コンセンサスゲーム「NASAゲーム オンライン版」
chibanba1982
PRO
0
700
IT業界向けグループワーク「THEクリティカルパス オンライン版」
chibanba1982
PRO
0
350
CFMフレームワークを活用した AWSコスト管理ガイドラインを策定した話
o2mami
2
440
株式会社LANY / Company Deck
lany
2
58k
営業疑似体験ゲーム「ヒアリングチャレンジ カード版」
chibanba1982
PRO
0
450
心理的安全性をテーマにしたチームビルディングゲーム「ベストチーム」
chibanba1982
PRO
0
700
FY2025_ASK会社案内
asking
1
160
ゲーム型ダイバーシティ&インクルージョン研修「バルーンバ人文化を探れ」
chibanba1982
PRO
0
150
Featured
See All Featured
Scaling GitHub
holman
459
140k
A Modern Web Designer's Workflow
chriscoyier
693
190k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
113
50k
Building Your Own Lightsaber
phodgson
104
6.2k
Git: the NoSQL Database
bkeepers
PRO
427
64k
Making the Leap to Tech Lead
cromwellryan
133
9k
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
356
29k
Become a Pro
speakerdeck
PRO
26
5.1k
A designer walks into a library…
pauljervisheath
205
24k
Why You Should Never Use an ORM
jnunemaker
PRO
54
9.1k
Creating an realtime collaboration tool: Agile Flush - .NET Oxford
marcduiker
26
1.9k
Visualization
eitanlees
146
15k
Transcript
OpenAI o1 プレビュー September 12, 2024
次世代AIの幕開け OpenAIはAI技術の新たな進化を象徴する「o1-preview」 を発表しました。このモデルは、より深く考え、より困難 な問題を解決できる能力を備えています。 人間の思考プロセスを模倣し、科学やコーディング、数学 の分野で際立った性能を発揮します。
o1-previewの特徴 問題解決の新しいアプローチ これまでのAIは、迅速な応答が求められましたが、o1はそ れとは異なり、問題解決に時間をかけて慎重に取り組みま す。モデルは、タスクに直面したときに複数の戦略を試 し、最適な解決策を見つける能力を持ちます。 私たちのテストでは、物理学、化学、生物学の困難な問題 において、博士課程の学生に匹敵する結果を達成しまし た。
数学とコーディングでの躍進 特に注目すべきは、数学とコーディング分野での大幅な性 能向上です。国際数学オリンピック(IMO)の予選試験に おいて、従来のモデルが13%しか解けなかった問題を、 o1-previewは83%の正答率で解決しました。 また、Codeforcesのプログラミングコンテストでは、89 パーセンタイルの成績を達成しました。
科学の進展を支える力 o1-previewは科学者にとっても大きな力を提供します。特 に複雑な物理学の問題や、生命科学における細胞シーケン シングのデータ注釈など、通常なら数時間かかる作業を短 時間で行うことが可能です。 このモデルは、問題の解決に向けて柔軟にアプローチを変 え、最も効果的な解決策を導き出します。
o1-mini: 開発者に最適なモデル 開発者に向けた「o1-mini」も同時に発表されました。こ れは、o1-previewの小型版であり、より高速かつ安価に複 雑なコーディングタスクを実行できます。 80%安価なコスト 高度なデバッグ能力 高速な推論速度 これにより、開発者は多くのシナリオで効率的なソリュー ションを得ることができます。
安全性の確保: 次世代AIの責任 o1-previewは、単なる問題解決能力だけではなく、安全性 にも大きな進歩を遂げています。私たちは、このモデルが セーフティルールを遵守する能力を大幅に強化しました。 テストの結果、最も難しい安全性テストでGPT-4が22点だ ったのに対し、o1-previewは84点を獲得しました。
安全性とガバナンスの強化 AIの進展に伴い、安全性と倫理がこれまで以上に重要な課 題となっています。OpenAIは米国および英国のAI安全性 研究所と協力し、モデルの評価およびテストを強化してい ます。これにより、将来的なAIのリリース前後における安 全性を確保します。 私たちは、内部ガバナンスやレッドチームテストを通じ て、AIの安全性向上を目指しています。
AIの未来を切り開く o1-previewは、私たちが抱える最も困難な問題に取り組む 能力を持つ新たなAI技術のスタートに過ぎません。将来的 には、ウェブの情報を取得したり、ファイルや画像をアッ プロードする機能などが追加される予定です。 この進化により、AIがどのように私たちの生活を改善し、 問題解決に役立つかが大きく変わるでしょう。
o1-previewの利用方法 現在、ChatGPT PlusとTeamのユーザーは、このo1シリー ズをモデルピッカーから手動で選択できます。また、 ChatGPT EnterpriseとEduユーザーも、来週からこのモデ ルを利用できるようになります。
o1-previewの特 徴 API経由でのプロトタイプ開発 も可能 1週間あたりのリクエスト回数 制限は30件 o1-miniは50件まで利用可能
今後の展望 OpenAIは、今後もo1シリーズをさらに発展させ、新しい 機能やモデルを追加していく予定です。この新しい推論モ デルは、AIの可能性を拡大し、多くの分野で応用されるこ とが期待されています。 次のアップデートでは、ファイルや画像のアップロード機 能など、より幅広いタスクに対応できるように進化する予 定です。