Slide 1

Slide 1 text

2025年7月13日 (日) Gemini CLI 初学者勉強会(#AI道場) @オンライン 豊田陽介( ) @youtoy 公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など

Slide 2

Slide 2 text

自己紹介 豊田陽介( ) @youtoy ▶ IT系イベント主催(2013年〜)、   登壇や運営なども ▶ 機械学習・IoT関連の   技術書の出版 ▶ メーカーフェア出展など   モノづくり関連の活動も ▶ 子ども向けのIT関連活動、他 プライベートでの活動 ▶ ガジェット ▶ 描画系/IoT/AI・機械学習系 ▶ JavaScript、ビジュアルプログラミング 好きな技術など

Slide 3

Slide 3 text

今日の話①:公開当日に試したGemini CLIの話など 記事投稿が 2025年6月25日

Slide 4

Slide 4 text

日本時間夜のGemini CLI公開から記事公開まで 23:23 試用中 23時ごろからお試し + 実況ポスト + 記事を書く 23:36 記事をポスト 22:42 リポジトリの 情報などを少し確認

Slide 5

Slide 5 text

今日の話②:FFmpeg と組み合わせてみた話 Gemini CLI でまずは 試して結果を確認 ついでに Claude Code + FFmpeg と Google AI Studio での動画入力 も試してみた

Slide 6

Slide 6 text

どちらも詳細はQiitaの記事に

Slide 7

Slide 7 text

Gemini CLI を公開日に試して 個人的に便利だった点

Slide 8

Slide 8 text

すぐに無料枠を使って試せた ※ 無料枠で使った入力データの扱われ方は気にする必要があるけど Gemini API の無料枠やアカウントを紐付けて 使う形での利用 アカウントを紐付けるほうは「Gemini 2.5 Pro」 の利用も可能に (Gemini API の無償版では使えないモデル)

Slide 9

Slide 9 text

Claude Code初登場時はウェイトリスト・従量課金 (詳細はQiitaの記事に) Claude Code初登場時(リサーチプレビュー での提供時)はウェイトリスト登録が必須 (日中に登録したら深夜には使えるように  なった、というくらいではあったものの)            + 当時はアカウントを紐付ける定額になる使い方 がなく、無料枠のない API での従量課金が必須

Slide 10

Slide 10 text

Claude Code が昨日対応した Windows での WSLなしでの利用も 当初からできていた (3日前のアップデートまでは入力まわりなど Windows版のバグが複数あったものの) ※ 自分が当初試したのは Mac で、その後に Windows でも試した

Slide 11

Slide 11 text

FFmpeg との 組み合わせの話

Slide 12

Slide 12 text

【※追記】 アカウントを連携させる使い方で 動画を直接よんでもらうことができず FFmpeg を組み合わせた流れでした (有償版の API を使う方法では試せてはいないです)

Slide 13

Slide 13 text

FFmpegについて コマンドラインで「動画・音声・動画コンテナ等」 を幅広く扱えて豊富なコーデックに対応したツール (OSS で Windows/macOS/Linux に対応) 形式変換・加工・再エンコードなどの様々な処理が 行える昔からある老舗のツール (自分が初めて触ったのが 20年くらい前というレベル感)

Slide 14

Slide 14 text

選定についてなど ・コマンドラインのツールなので相性が良さそう  + 老舗で OSS のツールなので、十分学習されている 試した動画は使っても問題ない 37秒くらいの適当なもので (最近、試作してたものの1つで  リングコン・Joy-Con の情報  ブラウザの API で取得して  描画に反映させる体験型の  コンテンツ)

Slide 15

Slide 15 text

プロンプトや構成の補足 【試したプロンプト】 「fileフォルダ内の動画をffmpegコマンドで  10秒ごとに画像にして、その画像を読み取って  内容を解説して」 【補足】 Gemini CLI が扱えるフォルダの直下に、「file」 という名前のフォルダを作成して、その中に動画 ファイルを置いた形

Slide 16

Slide 16 text

抽出された画像と得られた結果① 1枚目の画像です。 左上には、男性がリングコンのようなものを両手で持って いる映像が表示されています。右側には、黒い背景に、 黄色い同心円状のグラフィックと、その周りにカラフルな 光の粒子のようなものが表示されています。左下には、 コードのようなものが表示されていますが、内容は一部しか 見えません。 2枚目の画像です。 1枚目との違いは、右側のグラフィックです。同心円の色が 黄色から水色に変化し、カラフルな光の粒子の位置も 変わっています。男性の映像やコードの部分に大きな変化は 見られません。

Slide 17

Slide 17 text

抽出された画像と得られた結果② 3枚目の画像です。 右側のグラフィックの同心円の色が、さらに緑色に変化して います。光の粒子の位置も、前の画像から変わっています。 男性の映像やコードの部分に大きな変化は見られません。 4枚目の画像です。 右側のグラフィックの同心円が消え、代わりにピンク色の円が 表示されています。カラフルな光の粒子は、その円の周りを 漂うように表示されています。 この動画は、男性がリングコンのようなものを操作することで、右側のグラフィックが変化 する、という内容のようです。リングコンの動きに合わせて、同心円の色や光の粒子の動き がインタラクティブに変化している様子がうかがえます。左下のコードは、このインタラク ションを制御しているプログラムの一部であると考えられます。

Slide 18

Slide 18 text

FFmpeg での他の処理や 動画・音声の特徴を抽出できる他の コマンドラインツールも試してみたい!

Slide 19

Slide 19 text

終わり!