Claude CodeからNano Bananaによる画像生成チャレンジ！

Claude CodeからNano Bananaによる画像生成チャレンジ！ 2026/05/20 金子陽一 1

自己紹介金子陽一フリーランスのエンジニアサーバーサイドがメイン趣味：登山　日本百名山67/100 2

近況報告ポートフォリオリニューアルしました 3

はじめに 4

ここまでの振り返り 5 • 登山アシスタントAI「碧衣」作りました！ ◦ ベースはEC2+Claude Code ◦ 完全に自分用のため、自分特化にチューニング

「碧衣」の基本設計 6 設計思想アクティビティ駆動フレームワークユーザーの日常の活動（アクティビティ）を起点として、 AIが自律的に思考・行動するフレームワークで設計されています。
命名：金子動作フロー 1 情報の収集サードパーティーサービスからアクティビティ情報を横断的に収集 2 AIによる解釈人格（ペルソナ）を持った AIが、収集した内容を深く解釈 3 メッセージの還元解釈に基づいた最適なメッセージをユーザへフィードバック

次にやりたいこと 7  画像生成の自動化 Nano Bananaにアクセスして、登山やアクティビティに関連する画像を自動的に生成。  完全自動運用
1日1回のスケジュール実行により、人の手を介さずに完全自動で画像を生成・更新。  AIによる最適化その日のアクティビティ情報を Claude Codeが解析し、最適なプロンプトを自律的に生成。

関連情報の調査（システム構成編） 8

9  Gemini REST API Google AI Studioにて公開中。画像生成に関する詳細なドキュメントも完備されている。 
疎通の確認標準的なREST APIリクエストが可能な環境であれば、技術的な疎通自体に問題はない。  コスト面での留意点（従量課金） APIは従量課金制。目安として、 1k画像1枚あたり約15円程度のコストが発生する。 Nano BananaをAPIでリクエストできるか

Line Messaging APIに画像送信できるか 10  画像受付フォーマット API側には画像を受け付けるための専用フォーマットが定義されている。  URLベースの取得フロー
ファイルを直接送るのではなく、公開 URLを送り、LINE側がそこから画像を取得する。  2種類のURL送信メイン画像とプレビュー画像の URLを個別に送信する必要がある仕様。  実装上の工夫上記の仕様をクリアするため、システム構成における事前の工夫が不可欠である。

画像送信の実現手段 11  ストレージサービスの選定 Cloudinaryを選定。今回の利用範囲では無料で利用可能であり、導入コストを抑えられる。  公開URLの活用アップロードした画像を取得できる公開 URLが存在し、外部
サービスからの参照が容易。  動的なリサイズ機能 URLのGETクエリのみで、必要に応じたサイズ調整済み画像を取得可能。  LINE仕様との親和性リサイズと公開URLの特性が、LINEの画像送信仕様と非常に相性が良い。

システム構成イメージ 12 以下の仕組みで実現は可能そう Claude Code Gemini (Nano Banana🍌) LINE Cloudinary
1. 画像生成 2. 画像保存 3. メッセージ送信 (画像URLベース ) 4. 画像の取得

関連情報の調査（プロンプト編） 13

悩みポイント 14  「AIに画像生成用プロンプトを作ってもらう」ってどうすればいいんだろう？  意図したキャラクターを出すにはどうすればいい？  登山の画像を出して欲しいが、風景のディテールをプロンプトで表現するのはかなり難しいはず ...

唐突な疑問 15 • 「AIの、風景画像の認識精度」ってどれくらいなんだろうか？

風景画像の認識精度検証 16  AI(Claude)による画像解説山頂付近から撮影された夏の稜線風景です。手前右側に積み重なった岩石（山頂の岩場）があり、その奥にはハイマツ帯が広がっています。正面には複数の峰が連なる山脈が見え、緑豊かな斜面と岩稜が混在しています。空は青く晴れており、右側に積乱雲が発達しているのが見えます。
典型的な夏の晴天時の景色で、南アルプス系の山々を撮影したものと思われます。検証用：南アルプス系夏の稜線風景

仮説とコンセプト 17  風景やアクティビティの取得 Claudeに風景画像を読み込んでもらい、それをベースにテキストプロンプトを考案する。他のアクティビティ情報も入力値にする。
 キャラクターの固定ベース画像を使い「このキャラが◦◦ している」と指定することで、描写のブレを防ぐ。  ガイドラインの活用構成を明確にするガイドラインファイルを用意し、アウトプットの安定性を高める。 …これらがあればいけるのでは？

実践 18

19 MCP -> skillsへの移行  API利用の最適化元から1サービスごとに呼び出す外部APIは限られているため、MCPでパッケージ化されているメリットが少ない。
 リソース消費の抑制 MCPはコンテキストもメモリ消費も大きい。画像生成時のコンテキストウィンドウを節約したい。  システムの簡略化 MCPサーバーから必要な機能を skillsに移行し、全体の構造をシンプルにする。 ※ このあたりの話は次回のテーマにでも ...

各種サービスとの連携 20 • 色々調べながらAPI接続しました • 大きく詰まった箇所はなかったので省略！

碧衣の参考資料作成 21 • Nano Bananaで衣装データ作りました

22 構築プロセス Gemini & Claudeと対話しながら構築学習ソース AI画像生成ノウハウを「付け焼き刃」で学習重要なポイント 1. 風景再現の割り切り
主要要素さえ押さえていれば、厳密な風景の再現には拘らない 2. 「天気」と「光源」への拘りキャラクターが「登山の天気予報」を主体とするため、ここには詳細な説明を付与ガイドラインファイルの作成

実際の出力例 23

出力例　登山前日 24

出力例　登山当日 25

出力例　GPT-Image-2に切り替え 26 ※ i2iではありません

出力例　飛行機からの写真ベースで生成 27

出力例　下山連絡からの返信（Line連携強化） 28

まとめ・所感 29 再現性と品質向上 • 風景の質感がかなり綺麗に再現できている • 雰囲気がかなり近いところまで寄せてくる • 途中でGPT-Image-2に切り替えたら明らかに品質上がった LLMの特性と課題
LLMの性質上「もっとも妥当そうな選択肢」を選びたがるので、あまり「冒険」はしてくれない 💡 改善の方向性ここは冒険をしてくれるよう意識的なチューニングが必要そう

Claude CodeからNano Bananaによる画像生成チャレンジ！

Claude CodeからNano Bananaによる画像生成チャレンジ！

金子陽一(Yoichi Kaneko)

More Decks by 金子陽一(Yoichi Kaneko)

Other Decks in Technology

Featured

Transcript