Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Amazon Nova のトークナイザについて調べてみた

Sponsored · Your Podcast. Everywhere. Effortlessly. Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.

Amazon Nova のトークナイザについて調べてみた

Avatar for KOKI TAMURA

KOKI TAMURA

January 10, 2025
Tweet

More Decks by KOKI TAMURA

Other Decks in Programming

Transcript

  1. © Cloud Centric Corporation 2 クラウドで「ワクワク」を。 自己紹介 田村 晃輝 クラウドセントリック

    株式会社 インテグレーション技術部 JAWS-UG 富山支部 @koki46926199 元 富山県民 エンジニア歴 1年10ヵ月 AWS歴は1年ほど AWS汎用基盤における監視・運用設計、構築業務を担当 最近のトピック: エンジニアを始めるのと同時に太り始めました
  2. © Cloud Centric Corporation 8 クラウドで「ワクワク」を。 Amazon Nova のモデル種類 Amazon

    Nova:https://aws.amazon.com/jp/ai/generative-ai/nova/ Amazon Nova Micro 低コストかつ低レイテンシーなテキストのみを処理するモデル Amazon Nova Lite 抵コストかつ高速な、画像・動画・テキスト入力に対応しているマルチモーダルモデル Amazon Nova Pro 精度、速度、コストの最適な組み合わせを備えた高性能なマルチモーダルモデル Amazon Nova Canvas テキストや画像から画像を生成するモデル Amazon Nova Reel テキストや画像から動画を生成するモデル ※ 現在は6秒まで
  3. © Cloud Centric Corporation 9 クラウドで「ワクワク」を。 Amazon Nova ローンチ予定のモデル Amazon

    Nova Premiere 複雑な推論やカスタムモデル抽出に最適な高性能マルチモーダルモデル speech-to–speech model 音声の入力に対して音声で回答してくれるモデル multimodal-to-multimodal model マルチモーダルの入力に対してマルチモーダルで回答してくれるモデル
  4. © Cloud Centric Corporation 10 クラウドで「ワクワク」を。 ◦◦のシステムにチャットボット(Amazon Nova)を導入したいと思います! …コストの件、確認します。 提案者

    提案者 セキュリティは大丈夫? それに、コストはどれくらいかかるの? クライアント/上長 提案時に聞かれたことはありますか?
  5. © Cloud Centric Corporation 11 クラウドで「ワクワク」を。 コストを見てもトークンベースで記載されていてよく分からない… Bedrock Pricing:https://aws.amazon.com/jp/bedrock/pricing/ Prompt

    Caching:https://docs.aws.amazon.com/bedrock/latest/userguide/prompt-caching.html バッチ推論:https://docs.aws.amazon.com/bedrock/latest/userguide/batch-inference-data.html
  6. © Cloud Centric Corporation 12 クラウドで「ワクワク」を。 言語モデルが言語を理解するためのプロセス 今日は雪が降っている 今日 は

    雪 が 降っている 1 2 Token 3 4 5 [[0.1, 0.2, ...], [0.3, 0.4, ...], [0.5, 0.6, ...], [0.7, 0.8, ...], [0.9, 1.0, ...]] トークナイザによるトークン変換 (tokenization) ベクトル化(Embedding)
  7. © Cloud Centric Corporation 13 クラウドで「ワクワク」を。 トークナイザにも種類がある - 単語単位 英語のように単語がスペースで区切られている言語では簡単に分割可能だが

    日本語のように単語の区切りがない言語では、判断する仕組みが必要。 例: 「今日は雪が降っている」 → 「今日」「は」「雪」「が」「降って」「いる」 - 文字単位 例: 「今日は雪が降っている」 → 「今」「日」「は」「雪」「が」「降」「っ」「て」「い」「る」 - サブワード単位 単語をさらに細かい単位に分割する手法 例: 「今日は雪が降っている」 → 「今日」「##は」「雪」「##が」「降」「##って」「いる」 ※分割された単位をサブワードと呼び、「##」は前のトークンに続くサブワードを示している
  8. © Cloud Centric Corporation 15 クラウドで「ワクワク」を。 今回調査してみたモデルの紹介 Amazon Bedrock提供モデル -

    Amazon Nova Micro - Amazon Nova Lite ‐ Amazon Nova Pro - Claude 3.5 Sonnet v2 - Claude 3.5 Haiku OpenAI - ChatGPT 4o - ChatGPT 4o mini ※ Claude 3.5 Haiku は推論プロファイルの必要ないオレゴンリージョン(us-west-2) それ以外は、バージニア北部リージョン(us-east-1)にて確認
  9. © Cloud Centric Corporation 16 クラウドで「ワクワク」を。 Amazon Bedrock : トークン数の確認方法(コンソール)

    Chat / Text playground にて確認可能 ※ 1度に比較できるのは、比較モードを使用して2つまで
  10. © Cloud Centric Corporation 17 クラウドで「ワクワク」を。 Amazon Bedrock : トークン数の確認方法(Cloud

    Watch) Amazon Bedrockコンソールの設定画面から 「モデル呼び出しログの記録」を設定すると 入出力トークンとレイテンシーをCloudWatchメトリクス上でモデル別に参照することができます
  11. © Cloud Centric Corporation 18 クラウドで「ワクワク」を。 { “id”: “msg_bdrk_012cB1hStJLVPoy86PhDU5G8”, "type":

    "message", "role": "assistant", "model": "claude-3-5-sonnet-20240620", "content": [ { "type": "text", “text”: ‘“Bedrock”は…’ #回答 } ], "stop_reason": "end_turn", "stop_sequence": None, "usage": { "input_tokens": 18, # 質問文のトークン数 "output_tokens": 354, # 回答文のトークン数 "total_tokens": 372, # 合計トークン数 }, } Amazon Bedrock : トークン数の確認方法(Boto3) invoke_model を実行し 取得したパラメータの [“body”] に右のように データが格納されています
  12. © Cloud Centric Corporation 19 クラウドで「ワクワク」を。 Amazon Nova Micro /

    Lite / Pro 質問文:AWS re:Inventについて簡単に教えてください。 Model Input Tokens Output Tokens Total Tokens 実行時間(s) Nova Pro 9 410 419 5.4 Nova Lite 9 484 493 4.02 Nova Micro 9 460 469 2.85 AWS re : Invent について 簡単に 教えて ください 。 Input Tokensの分割イメージ(推測)
  13. © Cloud Centric Corporation 20 クラウドで「ワクワク」を。 Model Input Tokens Output

    Tokens Total Tokens 実行時間(s) Claude 3.5 Sonnet 23 409 432 8.21 Claude 3.5 Haiku 23 320 343 6.35 質問文:AWS re:Inventについて簡単に教えてください。 Claude 3.5 Sonnet / Haiku A W S re : In vent に つい て 簡 単 に 教 え て くだ さい 。 Input Tokensの分割イメージ(推測)
  14. © Cloud Centric Corporation 21 クラウドで「ワクワク」を。 ChatGPT 4o / 4o

    mini 質問文:AWS re:Inventについて簡単に教えてください。 OpenAI トークナイザ:https://platform.openai.com/tokenizer
  15. © Cloud Centric Corporation 22 クラウドで「ワクワク」を。 比較結果まとめ(2025/1/10 時点) Model Input

    Tokens Output Tokens Total Tokens 実行時間(s) Nova Pro 9 410 419 5.4 Nova Lite 9 484 493 4.02 Nova Micro 9 460 469 2.85 Claude 3.5 Sonnet 23 409 432 8.21 Claude 3.5 Haiku 23 320 343 6.35 GPT 4o / 4o mini 12 481 493 11.88 質問文:AWS re:Inventについて簡単に教えてください。
  16. © Cloud Centric Corporation 23 クラウドで「ワクワク」を。 Model Input Tokens Output

    Tokens Total Tokens 実行時間(s) Nova Pro 9 410 419 5.4 Nova Lite 9 484 493 4.02 Nova Micro 9 460 469 2.85 Claude 3.5 Sonnet 23 409 432 8.21 Claude 3.5 Haiku 23 320 343 6.35 GPT 4o / 4o mini 12 481 493 11.88 トークン分割数が少ない・・・!(2025/1/10 時点) 質問文:AWS re:Inventについて簡単に教えてください。
  17. © Cloud Centric Corporation 24 クラウドで「ワクワク」を。 Model Input Tokens Output

    Tokens Total Tokens 実行時間(s) Nova Pro 9 410 419 5.4 Nova Lite 9 484 493 4.02 Nova Micro 9 460 469 2.85 Claude 3.5 Sonnet 23 409 432 8.21 Claude 3.5 Haiku 23 320 343 6.35 GPT 4o / 4o mini 12 481 493 11.88 Nova Microの実行時間がとても短い…!(2025/1/10 時点) 質問文:AWS re:Inventについて簡単に教えてください。
  18. © Cloud Centric Corporation 26 クラウドで「ワクワク」を。 API料金 = 入力トークン数 ×

    利用単価 + 出力トークン数 × 利用単価 となるので、トークン数が少ない方がコスト面的には有利ですし モデルに渡す質問の文章量も多くすることが可能となります コスト計算について
  19. © Cloud Centric Corporation 28 クラウドで「ワクワク」を。 まとめ Amazon Novaのトークナイザの日本語理解能力が高い とにかく実行時間が短い(特にNova

    Micro) 最大トークン数(コンテキストウインドウ)が多いため、長い会話でも有用 回答速度を求められるサービスなどでは第一候補に挙がるのでは無いかと思いました まだまだ気になることはあるので、さらに検証を進めていきます