Upgrade to Pro — share decks privately, control downloads, hide ads and more …

新モデルOpenAI_o1_実際に試してみたらこうなった.pdf

makishy
September 18, 2024
290

 新モデルOpenAI_o1_実際に試してみたらこうなった.pdf

2024/09/18に登壇したLT資料です。
https://minorun365.connpass.com/event/331247/presentation/

makishy

September 18, 2024
Tweet

Transcript

  1. 2 KDDI Agile Development Center Corporation About Me 岸田 正吉

    KDDIアジャイル開発センター(ソフトウェアエンジニアリード)兼 KDDI DIGITAL GATE (エンジニアリングマネージャー) OA機器メーカーのソフトウェアエンジニア経験を経て2018年にKDDIに入社。 KDDI DIGITAL GATEにて金融、小売、製造、建設など幅広い業界/業種のお 客さまのDX事業立ち上げやアジャイル内製開発チーム立ち上げに従事。 現在は、生成AIセミナーを通じた社内外への活用推進、企業への導入支援、 LLMを用いたプロダクト開発など生成AI普及のため精力的に活動中。
  2. 3 KDDI Agile Development Center Corporation About Me Gemini 1.5

    Amazon Bedrock (Claude3) 新規事業企画アイデア創出 新規事業企画アイデア創出 +企画書作成 RAGを使った社内データ連携 Azure OpenAI Service (GPT-4) モデルの特性を活かしつつ、様々なLLMを使った社内外プロダクトを開発中
  3. 4 KDDI Agile Development Center Corporation はじめに 本日お話すること • OpenAI

    o1とは(概要をさらっと) • 実際に試してみたことを共有 ◦ 問題解決型タスク ◦ プログラミング お話しないこと • 生成AI・LLMに関する技術要素 • 導入事例
  4. 5 KDDI Agile Development Center Corporation OpenAI o1とは OpenAI社が開発した最新のLLMモデル。(2024年9月12日に発表) ChatGPT

    Plusとteamユーザーが12日から順次利用可能。無料のEnterpriseもしくはEduユーザーは今週から利用可能? 難しい問題を解決するための新しい推論モデルシリーズ • 物理、化学、生物の難しいタスクにおいて博士課程の学生と同等のパフォーマンスを発揮 • 数学やコーディング能力も優れている • Web閲覧、ファイル・画像入力による処理は未対応 • 複雑な推論タスクでの大きな進歩を示し、AIの新たなレベルを象徴
  5. 6 KDDI Agile Development Center Corporation OpenAI o1の制限 OpenAI o1-preview

    では週に 30 件50件のメッセージ、OpenAI o1-mini では週 1日に 50 件のメッセージまで利用 可能 OpenAI o1-preview および o1-mini モデルでは、次の高度なツールや機能にアクセスできない。 • メモリ • カスタム指示 • データ分析 • ファイルのアップロード • ウェブ閲覧 • GPTの発見と使用 • ビジョン • 音声入力 上記ツールを利用するには、GPT-4o に切り替える必要あり
  6. 9 KDDI Agile Development Center Corporation マンホール問題 深い推論が必要な問題を解いてみます。 「東京都内マンホールはいくつあるか?」 フェルミ推定の問題も非常にオーソドックスな例題の1つ

    フェルミ推定とは、実際に調査することが難しい数量や規模を、最低限の知識と論理的思考力を使って短時間 で推定する手法。 一見予想がつかない数値を、国土面積や身近にあるもの数などから論理的に推定します。日 常生活からビジネスまで幅広い場面で応用される手法です。
  7. 16 KDDI Agile Development Center Corporation neko-game 【ゲームの内容】 ゲームのキャラクターはネコ。 ネコは画面の左右に移動する。

    上から魚が降ってくる。 魚をキャッチするとポイントが加算、たまに犬が降ってきて、犬に 接触するとポイントが減算される。 ポイントがマイナスになったらゲーム終了。 なぞゲーム...
  8. 17 KDDI Agile Development Center Corporation プロンプト react.jsを使ってスマホゲームを作成します。viteを使ってプロジェクトを作成します。 言語は TypeScriptを使います。

    以下の内容に従ってゲームを作成してください。 ```ゲームの内容 ゲームのキャラクターはネコです。ネコは画面の左右に移動します。 上から魚が降ってきます。 魚をキャッチするとポイントが加算されます。たまに犬が降ってきて、犬に接触するとポイン トが減算されます。 ポイントがマイナスになったらゲーム終了です。
  9. 20 KDDI Agile Development Center Corporation できあがったゲーム 解説 • ネコの移動:

    画面のドラッグ操作でネコが左右に移動します。@use- gesture/react を使用してドラッグイベントを処理しています。 • オブジェクトの生成: 一定間隔で魚または犬のオブジェクトがランダムな位置から 降ってきます。 • 衝突判定: ネコとオブジェクトの位置関係を計算し、接触した場合にスコアを加算 または減算します。 • ゲームオーバー: スコアがマイナスになるとゲームオーバーになり、再スタートボ タンが表示されます。 キャラクターは自作してます
  10. 21 KDDI Agile Development Center Corporation GPT-4oに代替可能? o1 モデルは推論において大きな進歩をもたらすが、すべてのユースケースで GPT-4o

    を置き換えることを意図したも のではない。o1は利用可能な機能も限定的(高度なツールの利用不可) 画像入力、関数呼び出し、または一貫して高速な応答時間を必要とするアプリケーションの場合、GPT-4o および GPT-4o mini モデルは引き続き適切な選択です。ただし、深い推論を必要とし、より長い応答時間に対応できるアプリ ケーションの開発を目指している場合は、o1 モデルが最適な選択肢になる可能性があります。 【引用元】 https://platform.openai.com/docs/guides/reasoning/reasoning
  11. 22 KDDI Agile Development Center Corporation まとめ 2024年9月12日に新しいモデルOpenAI o1がリリース 難しい問題を解決するための新しい推論モデル

    深い推論やプログラミングなどを得意とする 利用可能な機能は限定的で、現状は高度なツールや機能は利用できない 深い推論や複雑なプログラミングが必要なユースケースでは最適な選択肢となる(かもしれない)