Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / G...
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
you(@youtoy)
PRO
July 13, 2025
Technology
3.7k
0
Share
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you(@youtoy)
PRO
July 13, 2025
More Decks by you(@youtoy)
See All by you(@youtoy)
AI時代だけど、わりと力業で追いかけている技術情報収集の話 / 20260518
you
PRO
0
0
最近の技術系の話題で気になったもの色々(IoT系以外も) / IoTLT 花見予定会(たぶんBBQ) @都立潮風公園バーベキュー広場
you
PRO
1
360
Babylon.js を使って試した色々な内容 / Various things I tried using Babylon.js / Babylon.js 勉強会 vol.5
you
PRO
0
440
イベントで大活躍する電子ペーパー名札を作る(その2) 〜 M5PaperとM5PaperS3 〜 / IoTLT @ JLCPCB オープンハードカンファレンス
you
PRO
0
280
Deno・Bunの標準機能やElysiaJSを使ったWebSocketサーバー実装 / ラーメン屋を貸し切ってLT会! IoTLT 2026新年会
you
PRO
0
350
M5Stack Chain DualKey を UIFlow 2.0 + USB接続で試す / ビジュアルプログラミングIoTLT vol.22
you
PRO
2
220
ローカルLLMをJavaScriptで(少しAIエージェントSDKなどの話も) / 冬のJavaScript祭り @Pleasanter Lounge
you
PRO
0
970
Webの技術で「特殊なゲーム用コントローラーや他デバイスなど」とブラウザを連携させる / HTML5 11th Anniversary
you
PRO
0
110
ブラウザのAPIで Nintendo Switch用の特殊なゲーム用コントローラーを体験型コンテンツに / IoTLT @ストラタシス・ジャパン
you
PRO
0
240
Other Decks in Technology
See All in Technology
R&D 祭 2024 アニメエフェクト作成の効率化
olmdrd
PRO
0
110
Claude Code / Codex / Kiro に AWS 権限を 渡すとき、何を設計すべきか
k_adachi_01
6
1.9k
Gaussian Splattingの実用化 - 映像制作への展開
gpuunite_official
0
210
Oracle AI Database@Google Cloud:サービス概要のご紹介
oracle4engineer
PRO
6
1.4k
社内RAGの導入で気を付けたポイント
yakumo
1
130
パーソルキャリア IT/テクノロジー職向け 会社紹介資料|Company Introduction Deck
techtekt
PRO
0
250
生成AI時代に信頼性をどう保ち続けるか - Policy as Code の実践
akitok_
1
530
AI全盛の今だからこそ、あえてもう一度振り返るAPIの基礎
smt7174
3
140
JTCでRedmine利用者2700人を実現した手法 第二部
nobuonakamura
0
150
AI時代に、 データアナリストがデータエンジニアに異動して
jackojacko_
0
1.1k
"スキルファースト"で作る、AIの自走環境
subroh0508
1
650
エムスリーテクノロジーズ株式会社 エンジニア向け紹介資料 / M3 Technologies Company Deck
m3_engineering
0
200
Featured
See All Featured
CSS Pre-Processors: Stylus, Less & Sass
bermonpainter
360
30k
Understanding Cognitive Biases in Performance Measurement
bluesmoon
32
2.9k
Hiding What from Whom? A Critical Review of the History of Programming languages for Music
tomoyanonymous
2
810
How to Grow Your eCommerce with AI & Automation
katarinadahlin
PRO
1
180
Reflections from 52 weeks, 52 projects
jeffersonlam
356
21k
Become a Pro
speakerdeck
PRO
31
5.9k
GraphQLとの向き合い方2022年版
quramy
50
15k
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
190
Faster Mobile Websites
deanohume
310
31k
Crafting Experiences
bethany
1
150
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.7k
State of Search Keynote: SEO is Dead Long Live SEO
ryanjones
0
190
Transcript
2025年7月13日 (日) Gemini CLI 初学者勉強会(#AI道場) @オンライン 豊田陽介( ) @youtoy 公開初日に
Gemini CLI を試した話や FFmpeg と組み合わせてみた話など
自己紹介 豊田陽介( ) @youtoy ▶ IT系イベント主催(2013年〜)、 登壇や運営なども ▶ 機械学習・IoT関連の
技術書の出版 ▶ メーカーフェア出展など モノづくり関連の活動も ▶ 子ども向けのIT関連活動、他 プライベートでの活動 ▶ ガジェット ▶ 描画系/IoT/AI・機械学習系 ▶ JavaScript、ビジュアルプログラミング 好きな技術など
今日の話①:公開当日に試したGemini CLIの話など 記事投稿が 2025年6月25日
日本時間夜のGemini CLI公開から記事公開まで 23:23 試用中 23時ごろからお試し + 実況ポスト + 記事を書く 23:36
記事をポスト 22:42 リポジトリの 情報などを少し確認
今日の話②:FFmpeg と組み合わせてみた話 Gemini CLI でまずは 試して結果を確認 ついでに Claude Code +
FFmpeg と Google AI Studio での動画入力 も試してみた
どちらも詳細はQiitaの記事に
Gemini CLI を公開日に試して 個人的に便利だった点
すぐに無料枠を使って試せた ※ 無料枠で使った入力データの扱われ方は気にする必要があるけど Gemini API の無料枠やアカウントを紐付けて 使う形での利用 アカウントを紐付けるほうは「Gemini 2.5 Pro」
の利用も可能に (Gemini API の無償版では使えないモデル)
Claude Code初登場時はウェイトリスト・従量課金 (詳細はQiitaの記事に) Claude Code初登場時(リサーチプレビュー での提供時)はウェイトリスト登録が必須 (日中に登録したら深夜には使えるように なった、というくらいではあったものの) +
当時はアカウントを紐付ける定額になる使い方 がなく、無料枠のない API での従量課金が必須
Claude Code が昨日対応した Windows での WSLなしでの利用も 当初からできていた (3日前のアップデートまでは入力まわりなど Windows版のバグが複数あったものの) ※
自分が当初試したのは Mac で、その後に Windows でも試した
FFmpeg との 組み合わせの話
【※追記】 アカウントを連携させる使い方で 動画を直接よんでもらうことができず FFmpeg を組み合わせた流れでした (有償版の API を使う方法では試せてはいないです)
FFmpegについて コマンドラインで「動画・音声・動画コンテナ等」 を幅広く扱えて豊富なコーデックに対応したツール (OSS で Windows/macOS/Linux に対応) 形式変換・加工・再エンコードなどの様々な処理が 行える昔からある老舗のツール (自分が初めて触ったのが
20年くらい前というレベル感)
選定についてなど ・コマンドラインのツールなので相性が良さそう + 老舗で OSS のツールなので、十分学習されている 試した動画は使っても問題ない 37秒くらいの適当なもので (最近、試作してたものの1つで リングコン・Joy-Con
の情報 ブラウザの API で取得して 描画に反映させる体験型の コンテンツ)
プロンプトや構成の補足 【試したプロンプト】 「fileフォルダ内の動画をffmpegコマンドで 10秒ごとに画像にして、その画像を読み取って 内容を解説して」 【補足】 Gemini CLI が扱えるフォルダの直下に、「file」 という名前のフォルダを作成して、その中に動画
ファイルを置いた形
抽出された画像と得られた結果① 1枚目の画像です。 左上には、男性がリングコンのようなものを両手で持って いる映像が表示されています。右側には、黒い背景に、 黄色い同心円状のグラフィックと、その周りにカラフルな 光の粒子のようなものが表示されています。左下には、 コードのようなものが表示されていますが、内容は一部しか 見えません。 2枚目の画像です。 1枚目との違いは、右側のグラフィックです。同心円の色が
黄色から水色に変化し、カラフルな光の粒子の位置も 変わっています。男性の映像やコードの部分に大きな変化は 見られません。
抽出された画像と得られた結果② 3枚目の画像です。 右側のグラフィックの同心円の色が、さらに緑色に変化して います。光の粒子の位置も、前の画像から変わっています。 男性の映像やコードの部分に大きな変化は見られません。 4枚目の画像です。 右側のグラフィックの同心円が消え、代わりにピンク色の円が 表示されています。カラフルな光の粒子は、その円の周りを 漂うように表示されています。 この動画は、男性がリングコンのようなものを操作することで、右側のグラフィックが変化
する、という内容のようです。リングコンの動きに合わせて、同心円の色や光の粒子の動き がインタラクティブに変化している様子がうかがえます。左下のコードは、このインタラク ションを制御しているプログラムの一部であると考えられます。
FFmpeg での他の処理や 動画・音声の特徴を抽出できる他の コマンドラインツールも試してみたい!
終わり!