Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Stable Diffusion楽しいぞい というお気持ちの共有

hoda
September 16, 2023

Stable Diffusion楽しいぞい というお気持ちの共有

社内のLT会で共有した資料

hoda

September 16, 2023
Tweet

More Decks by hoda

Other Decks in Technology

Transcript

  1. Stable Diffusion楽しいぞい
    というお気持ちの共有

    View full-size slide

  2. 自己紹介
    ● カスタマーサポート部を技術で支援するチームのBEエンジニア
    ○ ヘルプ管理、お問い合わせ管理システムの新規開発、新規機能の実装など。
    ● およそ2年にわたる大規模開発/改修が終わってホッとしている。
    ● 休息も束の間、また大規模なリファクタが控え、新機能の実装なども進行中なの
    で、引き続き頑張りたい。

    View full-size slide

  3. ChatGPTの盛り上がりを受けて、生成AIを触る機運が高まる
        ChatGPTすごいな、、
        Whisperの文字起こしもすごい、、
        そういえば、画像生成できるAIもあったな、、
        触ってみるか
    背景

    View full-size slide

  4. 背景
    さっそくStable Diffusion WebUIを試す
    →人物画像、風景画像などがボタンぽち〜で作れて感動
    だがしかしIntelコアのMacbook(2019年製)
    500x500pxの画像を生成するのに10min以上かかる

    View full-size slide

  5. 背景
    自分のPCだとつらいので、クラウド基盤の利用を検討
    MLOpsとまではいかずとも、
    可搬性の高い実行環境(コンテナ)がほしい
    できればお金をかけずに遊びたい
    Docker GPU
    Portable
    CLIベース 無料
    Scalable

    View full-size slide

  6. 背景
    Modal: モデル推論、バッチ処理、タスクキュー、ウェブアプリケーションなどをクラウド上
    で実行できるサービス
    ● CLIベース(基本的に手元のPCのターミナルからの操作で完結する)
    ● Dockerでコンテナライズしたアプリをデプロイ可能
    ● AWS S3、ECRなどと連携が可能(無料で使いたかったので今回は不使用)
    ● GitHub Actionの利用もOK
    ● 30[$/月]まで無料(小さめの画像なら約50000枚生成可能)
    2023/9/1時点では無料枠が10[$/月]に改定された模様😔

    View full-size slide

  7. Modalを使ってStable Diffusionを動かしてみた
    コードを準備できたら、「modal deploy」コマンドを実行。
    推論を実行するためのコードを元にコンテナ化し、一つのアプリケーションとして
    Modal上にデプロイ
    される。
    *今回、PythonのDiffusersライブラリを使って実装。モデルは学習済みのものを利用。

    View full-size slide

  8. Modalを使ってStable Diffusionを動かしてみた
    デプロイ後、命令(プロンプト)を出して画像出力

    View full-size slide

  9. 結果
    - 高解像度(3072x2048px)の画像をほいほい作れるようになった。
    - 生成速度(Nvidia A10G利用時):
    500x500px: 5~6[s]
    3072x2048px: 17~18[s]
    Modalについての感想
    - デプロイしたアプリケーションは破棄命令を出さない限り残り続けるのが良い( Google Colabだと一定時
    間経過後に揮発する)
    - アプリケーションが待機している間はコストがかからないので、使いたいときにすぐ再開できる。
    - CLIで操作を完結できるのがありがたい
    - 手元のPCでフォーマッター、リンターが効いた環境でコーディングしたコードをそのままデプロイできるの
    が良い(Google Colabは基本ブラウザベースなのでフォーマッター、リンターを使うのが難しい)

    View full-size slide

  10. おわり
    ● Stable Diffusionで遊びました!楽しかったです!
    ● リポジトリのURLと詳細
    https://github.com/hodanov/stable-diffusion-modal
    https://hodalog.com/running-stable-diffusion-cli-on-modal/

    View full-size slide