Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Strands AgentsとAmazon Novaで動画コンプライアンスチェックやってみた

Avatar for xthixsl_ml xthixsl_ml
July 03, 2025
33

Strands AgentsとAmazon Novaで動画コンプライアンスチェックやってみた

Avatar for xthixsl_ml

xthixsl_ml

July 03, 2025
Tweet

Transcript

  1. ©Fusic Co., Ltd. 1 自己紹介 はじめに 佐藤 礼央奈 R E

    O N A S AT O 株式会社Fusic エンジニア 東京の大学を卒業。在学中にエンジニアとして3社で約2年半の長期イン ターンを経験。機械学習や生成AIの研究開発に携わる中で、MLモデルの 本番運用に興味を持ちMLOpsに関心を深める。生成AIも取り入れた開発 や、AWSパートナー企業での経験から、同領域に強みを持つFusicに魅力 を感じ、2025年に新卒入社。
  2. ©Fusic Co., Ltd. 2 1. LLM・Agentsとは 2. Amazon Novaについて 3.

    Strands Agentsとは 4. やってみた 5. Appendix(詰まった箇所) 6. まとめ
  3. ©Fusic Co., Ltd. 4 Agentとは • ユーザーが具体的に指示 • 一度の処理で完結 •

    ユーザーの質問にそれっぽい答えを出力する • 外部のツールやサービスには自力でアクセス できない LLM Agent • LLMを使って特定のタスクを実行する • ユーザーがAgentにタスクを与え、Agentはタ スクを完遂させる • ツールやAPIを使ってタスクを自動実行する
  4. ©Fusic Co., Ltd. 5 Agentとは • ユーザーが具体的に指示 • 一度の処理で完結 •

    ユーザーの質問にそれっぽい答えを出力する • 外部のツールやサービスには自力でアクセス できない LLM Agent • LLMを使って特定のタスクを実行する • ユーザーがAgentにタスクを与え、Agentはタ スクを完遂させる • ツールやAPIを使ってタスクを自動実行する Amazon Nova Strands Agents
  5. ©Fusic Co., Ltd. 7 • Amazon Novaは、AWSが提供する最新の生成AI基盤モデルでAPIで利用可能 Amazon Novaについて モデル名

    特徴 Amazon Nova Micro テキスト専用の最速モデル。低レイテンシーで非常に低コスト。 最大128,000トークン Amazon Nova Lite 非常に低コストなマルチモーダルモデル。画像、動画、テキスト入 力を高速処理。最大300,000トークン Amazon Nova Pro 高性能マルチモーダルモデル。精度、速度、コストのベストバラン ス。幅広いタスクに対応。最大300,000トークン Amazon Nova Premier 最も高性能なマルチモーダルモデル。複雑なタスクに最適。最大 100万トークン ※ 他にも画像・音声生成モデルもあります 引用:https://aws.amazon.com/jp/ai/generative-ai/nova/
  6. ©Fusic Co., Ltd. 8 Amazon Novaについて モデル名 特徴 Amazon Nova

    Micro テキスト専用の最速モデル。低レイテンシーで非常に低コスト。 最大128,000トークン Amazon Nova Lite 非常に低コストなマルチモーダルモデル。画像、動画、テキスト入 力を高速処理。最大300,000トークン Amazon Nova Pro 高性能マルチモーダルモデル。精度、速度、コストのベストバラン ス。幅広いタスクに対応。最大300,000トークン Amazon Nova Premier 最も高性能なマルチモーダルモデル。複雑なタスクに最適。最大 100万トークン ※ 他にも画像・音声生成モデルもあります 引用:https://aws.amazon.com/jp/ai/generative-ai/nova/ 今回はこれ使います • Amazon Novaは、AWSが提供する最新の生成AI基盤モデルでAPIで利用可能
  7. ©Fusic Co., Ltd. 11 • AWS発のオープンソースモデル駆動型のAIエージェント構築SDK • 数行のPythonコードでエージェント作成 • 特徴

    • LLMの推論力を活用 • Chain-of-Thought • ツールの自動呼び出し • Python実行ツール • 計算ツール • シェル実行ツール Strands Agentsとは https://github.com/strands-agents/tools?tab=readme-ov-file#tools-overview より
  8. ©Fusic Co., Ltd. 12 • AWS発のオープンソースモデル駆動型のAIエージェント構築SDK • 数行のPythonコードでエージェント作成 • 特徴

    • LLMの推論力を活用 • Chain-of-Thought • ツールの自動呼び出し • Python実行ツール • 計算ツール • シェル実行ツール Strands Agentsとは 自作することが可能 https://github.com/strands-agents/tools?tab=readme-ov-file#tools-overview より
  9. ©Fusic Co., Ltd. 21 Appendix • 使用した動画 • https://huggingface.co/datasets/Corran/pexelvideosより •

    https://www.pexels.com/video/solar-system-project-7605257/ • 8秒 • 1920x1080のフルHD • 4.8 MB • 入力トークン • 15482 Tokens • 約0.0387ドル ※1 • 出力トークン • 2037 Tokens • 約0.0255ドル ※1 ※1 オレゴンリージョンで計算しています https://aws.amazon.com/jp/bedrock/pricing/ 約0.06ドル
  10. ©Fusic Co., Ltd. 22 Appendix • 使用した動画 • https://huggingface.co/datasets/Corran/pexelvideosより •

    https://www.pexels.com/video/a-man-drinking-a-cup-of-coffee-7605034/ • 27秒 • 2160x4096のシネマ4K • 44.2 MB 解析不可
  11. ©Fusic Co., Ltd. 23 Appendix なぜ解析できないのか • Base64エンコードを使用しているため • 最大25MBしかサポートされてない

    Before 解決方法 After • S3 URI使用する • 最大1GBまでサポート https://docs.aws.amazon.com/nova/latest/userguide/modalities-video.htmlより
  12. ©Fusic Co., Ltd. 25 Thank You We are Hiring! https://recruit.fusic.co.jp/

    ご清聴いただきありがとうございました