Slide 24
Slide 24 text
GPT-4 Turbo でチャンク化が不要になるかも?
文書全体をプロンプトに含めた場合にチャンク化をした場合と比較して適切な回答文の生成ができるかなどまだ情報が少ないため
しばらく注視が必要。だが、将来的にはチャンク化が不要になる可能性もある
• Azure OpenAI Service models - Azure OpenAI | Microsoft Learn
• GPT-4 Turbo with Vision on Azure OpenAI Service (microsoft.com)
• Azure OpenAI Service Launches GPT-4 Turbo and GPT-3.5-Turbo-1106 Models - Microsoft Community Hub
• OpenAI 言語モデルで日本語を扱う際のトークン数推定指標 (zenn.dev)
モデル バージョン 最大トークン 最大日本語文字数
(推定)
料金 (1,000トークンあたり)
gpt-35-turbo 0613 4,096 3,756 $0.0015
gpt-35-turbo-16k 0613 16,384 15,024 $0.003
gpt-35-turbo 1106 入力: 16,385
出力: 4,096
入力: 15,025
出力: 3,756
入力: $0.001
出力: $0.002
gpt-4 0613 8,192 7,512 $0.03
gpt-4-32k 0613 32,768 30,048 0.06
gpt-4 Turbo 1106-preview 入力: 128,000
出力: 4,096
入力: 117,376
出力: 3,756
入力: $0.01 / 1000 tokens
出力: $0.03 / 1000 tokens
※ 最大日本語文字数は 1 トークン 0.917 文字で計算。
New
New Japan
Region
は今後
Japan
Region
は今後
ファイルを分割した方が
いいのか?