Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / G...
Search
you(@youtoy)
PRO
July 13, 2025
Technology
0
3.4k
公開初日に Gemini CLI を試した話や FFmpeg と組み合わせてみた話など / Gemini CLI 初学者勉強会(#AI道場)
you(@youtoy)
PRO
July 13, 2025
Tweet
Share
More Decks by you(@youtoy)
See All by you(@youtoy)
イベントで大活躍する電子ペーパー名札を作る(その2) 〜 M5PaperとM5PaperS3 〜 / IoTLT @ JLCPCB オープンハードカンファレンス
you
PRO
0
200
Deno・Bunの標準機能やElysiaJSを使ったWebSocketサーバー実装 / ラーメン屋を貸し切ってLT会! IoTLT 2026新年会
you
PRO
0
330
M5Stack Chain DualKey を UIFlow 2.0 + USB接続で試す / ビジュアルプログラミングIoTLT vol.22
you
PRO
2
190
ローカルLLMをJavaScriptで(少しAIエージェントSDKなどの話も) / 冬のJavaScript祭り @Pleasanter Lounge
you
PRO
0
960
Webの技術で「特殊なゲーム用コントローラーや他デバイスなど」とブラウザを連携させる / HTML5 11th Anniversary
you
PRO
0
94
ブラウザのAPIで Nintendo Switch用の特殊なゲーム用コントローラーを体験型コンテンツに / IoTLT @ストラタシス・ジャパン
you
PRO
0
210
ローカルLLMとLINE Botの組み合わせ その2(EVO-X2でgpt-oss-120bを利用) / LINE DC Generative AI Meetup #7
you
PRO
1
920
生成AIとM5Stack / M5 Japan Tour 2025 Autumn 東京
you
PRO
0
480
子ども向けの活動や自身のモノづくり活動などでやったこと / micro:bit ファンの集い
you
PRO
0
57
Other Decks in Technology
See All in Technology
中央集権型を脱却した話 分散型をやめて、連邦型にたどり着くまで
sansantech
PRO
1
340
AIエージェント勉強会第3回 エージェンティックAIの時代がやってきた
ymiya55
0
110
既存アプリの延命も,最新技術での新規開発も:WebSphereの最新情報
ktgrryt
0
160
俺の/私の最強アーキテクチャ決定戦開催 ― チームで新しいアーキテクチャに適合していくために / 20260322 Naoki Takahashi
shift_evolve
PRO
1
430
ReactのdangerouslySetInnerHTMLは“dangerously”だから危険 / Security.any #09 卒業したいセキュリティLT
flatt_security
0
480
スケールアップ企業でQA組織が機能し続けるための組織設計と仕組み〜ボトムアップとトップダウンを両輪としたアプローチ〜
qa
0
230
モジュラモノリス導入から4年間の総括:アーキテクチャと組織の相互作用について / Architecture and Organizational Interaction
nazonohito51
3
1.7k
Phase09_自動化_仕組み化
overflowinc
0
1.6k
_Architecture_Modernization_から学ぶ現状理解から設計への道のり.pdf
satohjohn
2
740
LINEヤフーにおけるAIOpsの現在地
lycorptech_jp
PRO
5
2.2k
AI時代のIssue駆動開発のススメ
moongift
PRO
0
150
Phase01_AI座学_基礎
overflowinc
0
3.6k
Featured
See All Featured
Templates, Plugins, & Blocks: Oh My! Creating the theme that thinks of everything
marktimemedia
31
2.7k
The Organizational Zoo: Understanding Human Behavior Agility Through Metaphoric Constructive Conversations (based on the works of Arthur Shelley, Ph.D)
kimpetersen
PRO
0
270
Leadership Guide Workshop - DevTernity 2021
reverentgeek
1
250
A Soul's Torment
seathinner
5
2.5k
Chasing Engaging Ingredients in Design
codingconduct
0
150
Design of three-dimensional binary manipulators for pick-and-place task avoiding obstacles (IECON2024)
konakalab
0
390
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
150
Winning Ecommerce Organic Search in an AI Era - #searchnstuff2025
aleyda
1
1.9k
No one is an island. Learnings from fostering a developers community.
thoeni
21
3.6k
Documentation Writing (for coders)
carmenintech
77
5.3k
Paper Plane (Part 1)
katiecoart
PRO
0
5.8k
Design in an AI World
tapps
0
180
Transcript
2025年7月13日 (日) Gemini CLI 初学者勉強会(#AI道場) @オンライン 豊田陽介( ) @youtoy 公開初日に
Gemini CLI を試した話や FFmpeg と組み合わせてみた話など
自己紹介 豊田陽介( ) @youtoy ▶ IT系イベント主催(2013年〜)、 登壇や運営なども ▶ 機械学習・IoT関連の
技術書の出版 ▶ メーカーフェア出展など モノづくり関連の活動も ▶ 子ども向けのIT関連活動、他 プライベートでの活動 ▶ ガジェット ▶ 描画系/IoT/AI・機械学習系 ▶ JavaScript、ビジュアルプログラミング 好きな技術など
今日の話①:公開当日に試したGemini CLIの話など 記事投稿が 2025年6月25日
日本時間夜のGemini CLI公開から記事公開まで 23:23 試用中 23時ごろからお試し + 実況ポスト + 記事を書く 23:36
記事をポスト 22:42 リポジトリの 情報などを少し確認
今日の話②:FFmpeg と組み合わせてみた話 Gemini CLI でまずは 試して結果を確認 ついでに Claude Code +
FFmpeg と Google AI Studio での動画入力 も試してみた
どちらも詳細はQiitaの記事に
Gemini CLI を公開日に試して 個人的に便利だった点
すぐに無料枠を使って試せた ※ 無料枠で使った入力データの扱われ方は気にする必要があるけど Gemini API の無料枠やアカウントを紐付けて 使う形での利用 アカウントを紐付けるほうは「Gemini 2.5 Pro」
の利用も可能に (Gemini API の無償版では使えないモデル)
Claude Code初登場時はウェイトリスト・従量課金 (詳細はQiitaの記事に) Claude Code初登場時(リサーチプレビュー での提供時)はウェイトリスト登録が必須 (日中に登録したら深夜には使えるように なった、というくらいではあったものの) +
当時はアカウントを紐付ける定額になる使い方 がなく、無料枠のない API での従量課金が必須
Claude Code が昨日対応した Windows での WSLなしでの利用も 当初からできていた (3日前のアップデートまでは入力まわりなど Windows版のバグが複数あったものの) ※
自分が当初試したのは Mac で、その後に Windows でも試した
FFmpeg との 組み合わせの話
【※追記】 アカウントを連携させる使い方で 動画を直接よんでもらうことができず FFmpeg を組み合わせた流れでした (有償版の API を使う方法では試せてはいないです)
FFmpegについて コマンドラインで「動画・音声・動画コンテナ等」 を幅広く扱えて豊富なコーデックに対応したツール (OSS で Windows/macOS/Linux に対応) 形式変換・加工・再エンコードなどの様々な処理が 行える昔からある老舗のツール (自分が初めて触ったのが
20年くらい前というレベル感)
選定についてなど ・コマンドラインのツールなので相性が良さそう + 老舗で OSS のツールなので、十分学習されている 試した動画は使っても問題ない 37秒くらいの適当なもので (最近、試作してたものの1つで リングコン・Joy-Con
の情報 ブラウザの API で取得して 描画に反映させる体験型の コンテンツ)
プロンプトや構成の補足 【試したプロンプト】 「fileフォルダ内の動画をffmpegコマンドで 10秒ごとに画像にして、その画像を読み取って 内容を解説して」 【補足】 Gemini CLI が扱えるフォルダの直下に、「file」 という名前のフォルダを作成して、その中に動画
ファイルを置いた形
抽出された画像と得られた結果① 1枚目の画像です。 左上には、男性がリングコンのようなものを両手で持って いる映像が表示されています。右側には、黒い背景に、 黄色い同心円状のグラフィックと、その周りにカラフルな 光の粒子のようなものが表示されています。左下には、 コードのようなものが表示されていますが、内容は一部しか 見えません。 2枚目の画像です。 1枚目との違いは、右側のグラフィックです。同心円の色が
黄色から水色に変化し、カラフルな光の粒子の位置も 変わっています。男性の映像やコードの部分に大きな変化は 見られません。
抽出された画像と得られた結果② 3枚目の画像です。 右側のグラフィックの同心円の色が、さらに緑色に変化して います。光の粒子の位置も、前の画像から変わっています。 男性の映像やコードの部分に大きな変化は見られません。 4枚目の画像です。 右側のグラフィックの同心円が消え、代わりにピンク色の円が 表示されています。カラフルな光の粒子は、その円の周りを 漂うように表示されています。 この動画は、男性がリングコンのようなものを操作することで、右側のグラフィックが変化
する、という内容のようです。リングコンの動きに合わせて、同心円の色や光の粒子の動き がインタラクティブに変化している様子がうかがえます。左下のコードは、このインタラク ションを制御しているプログラムの一部であると考えられます。
FFmpeg での他の処理や 動画・音声の特徴を抽出できる他の コマンドラインツールも試してみたい!
終わり!