Slide 26
Slide 26 text
Gemini 1.5 Pro
• Googleは100万トークンのGemini 1.5 ProをGoogle AI Studioで公開
• ネイティブオーディオの理解
• Gemini API と Google AI Studio の両⽅で使える
• ビデオの画像 (フレーム) とオーディオ (⾳声) の両⽅を理解できる
• ファイルAPI
• プロジェクトごとに最⼤ 20 GB、ファイルサイズの上限は2GB、アップロード後2⽇で削除
• 画像、動画、⾳声ファイル対応
• System InstructionとJSONモードの導⼊
• 役割、形式、⽬標、ルールを定義して、特定のユースケースに合わせてモデルの動作を制御できる
• JOSNモードでは、テキストまたは画像から構造化データを抽出できる
• function callingの改善
• 関数呼び出しモードで使うか使わないかわからないAUTO, 必ず呼ぶANY, 使わないNoneが選べる
• テキスト埋め込みモデルtext-embedding-004もリリース
https://ai.google.dev/gemini-api/docs/function-calling?hl=ja
https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-preview-with-new-features.html