新モデルOpenAI_o1_実際に試してみたらこうなった.pdf

新モデルOpenAI o1 実際に試してみたらこうなった 2024.09.18 KDDI アジャイル開発センター岸田正吉

2 KDDI Agile Development Center Corporation About Me 岸田正吉
KDDIアジャイル開発センター（ソフトウェアエンジニアリード）兼 KDDI DIGITAL GATE （エンジニアリングマネージャー） OA機器メーカーのソフトウェアエンジニア経験を経て2018年にKDDIに入社。 KDDI DIGITAL GATEにて金融、小売、製造、建設など幅広い業界/業種のお客さまのDX事業立ち上げやアジャイル内製開発チーム立ち上げに従事。現在は、生成AIセミナーを通じた社内外への活用推進、企業への導入支援、 LLMを用いたプロダクト開発など生成AI普及のため精力的に活動中。

3 KDDI Agile Development Center Corporation About Me Gemini 1.5
Amazon Bedrock (Claude3) 新規事業企画アイデア創出新規事業企画アイデア創出 +企画書作成 RAGを使った社内データ連携 Azure OpenAI Service (GPT-4) モデルの特性を活かしつつ、様々なLLMを使った社内外プロダクトを開発中

4 KDDI Agile Development Center Corporation はじめに本日お話すること • OpenAI
o1とは（概要をさらっと） • 実際に試してみたことを共有 ◦ 問題解決型タスク ◦ プログラミングお話しないこと • 生成AI・LLMに関する技術要素 • 導入事例

5 KDDI Agile Development Center Corporation OpenAI o1とは OpenAI社が開発した最新のLLMモデル。（2024年9月12日に発表） ChatGPT
Plusとteamユーザーが12日から順次利用可能。無料のEnterpriseもしくはEduユーザーは今週から利用可能？難しい問題を解決するための新しい推論モデルシリーズ • 物理、化学、生物の難しいタスクにおいて博士課程の学生と同等のパフォーマンスを発揮 • 数学やコーディング能力も優れている • Web閲覧、ファイル・画像入力による処理は未対応 • 複雑な推論タスクでの大きな進歩を示し、AIの新たなレベルを象徴

6 KDDI Agile Development Center Corporation OpenAI o1の制限 OpenAI o1-preview
では週に 30 件50件のメッセージ、OpenAI o1-mini では週 1日に 50 件のメッセージまで利用可能 OpenAI o1-preview および o1-mini モデルでは、次の高度なツールや機能にアクセスできない。 • メモリ • カスタム指示 • データ分析 • ファイルのアップロード • ウェブ閲覧 • GPTの発見と使用 • ビジョン • 音声入力上記ツールを利用するには、GPT-4o に切り替える必要あり

使ってみる

8 KDDI Agile Development Center Corporation 問題解決型タスク

9 KDDI Agile Development Center Corporation マンホール問題深い推論が必要な問題を解いてみます。「東京都内マンホールはいくつあるか？」フェルミ推定の問題も非常にオーソドックスな例題の1つ
フェルミ推定とは、実際に調査することが難しい数量や規模を、最低限の知識と論理的思考力を使って短時間で推定する手法。一見予想がつかない数値を、国土面積や身近にあるもの数などから論理的に推定します。日常生活からビジネスまで幅広い場面で応用される手法です。

10 KDDI Agile Development Center Corporation プロンプト東京都内にマンホールがいくつあるか、フェルミ推定を行ってください

11 KDDI Agile Development Center Corporation GPT-4oの回答道路の占める面積ざっくり20% 推定結果
88,000個

12 KDDI Agile Development Center Corporation OpenAI o1-previewの回答 GPT4oに比べるともう少し細かく推定
推定結果 40万個

13 KDDI Agile Development Center Corporation 正解は？

14 KDDI Agile Development Center Corporation o1思考の概要 o1ではどういった思考で結果が得られたか、その概要を確認することができる

15 KDDI Agile Development Center Corporation プログラミング

16 KDDI Agile Development Center Corporation neko-game 【ゲームの内容】ゲームのキャラクターはネコ。ネコは画面の左右に移動する。
上から魚が降ってくる。魚をキャッチするとポイントが加算、たまに犬が降ってきて、犬に接触するとポイントが減算される。ポイントがマイナスになったらゲーム終了。なぞゲーム...

17 KDDI Agile Development Center Corporation プロンプト react.jsを使ってスマホゲームを作成します。viteを使ってプロジェクトを作成します。言語は TypeScriptを使います。
以下の内容に従ってゲームを作成してください。 ```ゲームの内容ゲームのキャラクターはネコです。ネコは画面の左右に移動します。上から魚が降ってきます。魚をキャッチするとポイントが加算されます。たまに犬が降ってきて、犬に接触するとポイントが減算されます。ポイントがマイナスになったらゲーム終了です。

デモ

19 KDDI Agile Development Center Corporation OpenAI o1-previewの回答ディレクトリ構成やコンポーネント化まで考慮して生成し
てくれる

20 KDDI Agile Development Center Corporation できあがったゲーム解説 • ネコの移動:
画面のドラッグ操作でネコが左右に移動します。@use- gesture/react を使用してドラッグイベントを処理しています。 • オブジェクトの生成: 一定間隔で魚または犬のオブジェクトがランダムな位置から降ってきます。 • 衝突判定: ネコとオブジェクトの位置関係を計算し、接触した場合にスコアを加算または減算します。 • ゲームオーバー: スコアがマイナスになるとゲームオーバーになり、再スタートボタンが表示されます。キャラクターは自作してます

21 KDDI Agile Development Center Corporation GPT-4oに代替可能？ o1 モデルは推論において大きな進歩をもたらすが、すべてのユースケースで GPT-4o
を置き換えることを意図したものではない。o1は利用可能な機能も限定的（高度なツールの利用不可）画像入力、関数呼び出し、または一貫して高速な応答時間を必要とするアプリケーションの場合、GPT-4o および GPT-4o mini モデルは引き続き適切な選択です。ただし、深い推論を必要とし、より長い応答時間に対応できるアプリケーションの開発を目指している場合は、o1 モデルが最適な選択肢になる可能性があります。【引用元】 https://platform.openai.com/docs/guides/reasoning/reasoning

22 KDDI Agile Development Center Corporation まとめ 2024年9月12日に新しいモデルOpenAI o1がリリース難しい問題を解決するための新しい推論モデル
深い推論やプログラミングなどを得意とする利用可能な機能は限定的で、現状は高度なツールや機能は利用できない深い推論や複雑なプログラミングが必要なユースケースでは最適な選択肢となる（かもしれない）

Be a Change Leader. アジャイルに力を与え共に成長し続ける社会を創る

新モデルOpenAI_o1_実際に試してみたらこうなった.pdf

新モデルOpenAI_o1_実際に試してみたらこうなった.pdf

makishy

More Decks by makishy

Featured

Transcript

新モデルOpenAI o1 実際に試してみたらこうなった 2024.09.18 KDDI アジャイル開発センター岸田正吉

2 KDDI Agile Development Center Corporation About Me 岸田正吉

3 KDDI Agile Development Center Corporation About Me Gemini 1.5

4 KDDI Agile Development Center Corporation はじめに本日お話すること • OpenAI

5 KDDI Agile Development Center Corporation OpenAI o1とは OpenAI社が開発した最新のLLMモデル。（2024年9月12日に発表） ChatGPT

6 KDDI Agile Development Center Corporation OpenAI o1の制限 OpenAI o1-preview

使ってみる

8 KDDI Agile Development Center Corporation 問題解決型タスク

9 KDDI Agile Development Center Corporation マンホール問題深い推論が必要な問題を解いてみます。「東京都内マンホールはいくつあるか？」フェルミ推定の問題も非常にオーソドックスな例題の1つ

10 KDDI Agile Development Center Corporation プロンプト東京都内にマンホールがいくつあるか、フェルミ推定を行ってください

11 KDDI Agile Development Center Corporation GPT-4oの回答道路の占める面積ざっくり20% 推定結果

12 KDDI Agile Development Center Corporation OpenAI o1-previewの回答 GPT4oに比べるともう少し細かく推定

13 KDDI Agile Development Center Corporation 正解は？

14 KDDI Agile Development Center Corporation o1思考の概要 o1ではどういった思考で結果が得られたか、その概要を確認することができる

15 KDDI Agile Development Center Corporation プログラミング

16 KDDI Agile Development Center Corporation neko-game 【ゲームの内容】ゲームのキャラクターはネコ。ネコは画面の左右に移動する。

17 KDDI Agile Development Center Corporation プロンプト react.jsを使ってスマホゲームを作成します。viteを使ってプロジェクトを作成します。言語は TypeScriptを使います。

デモ

19 KDDI Agile Development Center Corporation OpenAI o1-previewの回答ディレクトリ構成やコンポーネント化まで考慮して生成し

20 KDDI Agile Development Center Corporation できあがったゲーム解説 • ネコの移動:

21 KDDI Agile Development Center Corporation GPT-4oに代替可能？ o1 モデルは推論において大きな進歩をもたらすが、すべてのユースケースで GPT-4o

22 KDDI Agile Development Center Corporation まとめ 2024年9月12日に新しいモデルOpenAI o1がリリース難しい問題を解決するための新しい推論モデル

Be a Change Leader. アジャイルに力を与え共に成長し続ける社会を創る