Lock in $30 Savings on PRO—Offer Ends Soon! ⏳

KlarSky開発譚センサーダストとのAI開発戦記

Avatar for T. Fujiba T. Fujiba
December 13, 2025

 KlarSky開発譚センサーダストとのAI開発戦記

写真家の個人的課題「センサーダストの検出」をYOLOv8で解決しようとした1ヶ月の開発記録。MLOps初心者がHydra/MLflow/Vertex AIでパイプラインを構築し、M1 Macのエラー地獄やGCS課金爆発と格闘した実録。mAPだけでは測れないモデルの「性格」分析も。結局Adobeが同機能をリリースしたオチ付き。

技術スタック: YOLOv8, PyTorch, Vertex AI, MLflow, Hydra, Label Studio, CLAHE
詳細: https://zenn.dev/fujiba/books/klarsky-yolov8-mlops-vertexai-beginner-guide
デモ: https://huggingface.co/spaces/fujiba/klarsky-app-experimental

Avatar for T. Fujiba

T. Fujiba

December 13, 2025
Tweet

More Decks by T. Fujiba

Other Decks in Technology

Transcript

  1. ひとまずやってみる:概念検証と早期可視化 最初の技術選定 • 言語: Python • フレームワーク: PyTorch • 物体検出モデル:

    YOLOv8 • アノテーションツール: Label Studio • 確認UI: Gradio まずは手持ちの写真10枚で概念実証 ( P o C )を実施。重要なのは、実 用的な精度ではなく、「データ準備 →学習→結果確認」という一連のパ イプラインがエラーなく通ることの 確認である。 データ準備 学習 結果確認 デモアプリを早く 作ったのは・・・ 「小さく正しく動く」もの を早く作って見ることでモ チベーション維持していく こと、可視化することでモ デルの「癖」を掴みやすく することを目指した。 まあ、動くものがある方が 楽しいよね。
  2. プロジェクトの危険な匂い:MLOpsへの誘い • 問題と着想 Vibeな感じでスクリプト量産するもとっ散らかってしまい、破 綻が見えていた ハイパーパラメータを振ったりを効率的に行えないとスケール しない(再現性の確保) • 再現性を支える2大ツール •

    Hydra: 設定をコードから分離 実験ごとにパラメータを書き換えるのはありえない、パラ メータをYAMLへ分離、ちょっとした変更だけCLIオプショ ンで指定可能 • MLflow: 実験結果の可視化・比較 Hydraで実行された実験のパラメータ、メトリクス、成果 物を自動で記録。過去の実験結果を一目瞭然で比較・検討 できる。 データ収集 データ前処理 (CLAHE) アノテーション (Label Studio) データセット 作成 学習 モデル 評価 モデル 登録 性能不足 性能良好 # imgsz と lr0 の値を変更して実験を実行 pipenv run python klarsky/main.py training.imgsz=640 training.lr0=0.005
  3. ストレージに溶けた金w 当初、手軽さからGCS FUSEマウント を利用していたが、これがGCSの操作 料金を高額にする原因に。1ヶ月の GCP費用17,866円のうち、Cloud Storageが6,460円。その大半(5,908 円)はファイルリスト表示などの Class A

    Operations料金だった。 いえ、最初はローカルへのコピーを提 案してきてたんですよ。うっかり「ん なことせんでも、マウントされてるや ん」って言わなければ(爆