$30 off During Our Annual Pro Sale. View Details »

ピクシブの機械学習基盤 (PIXIV MEETUP 2023版)

sugakoji
October 10, 2023

ピクシブの機械学習基盤 (PIXIV MEETUP 2023版)

sugakoji

October 10, 2023
Tweet

More Decks by sugakoji

Other Decks in Programming

Transcript

  1. pixiv.inc
    ピクシブ
    機械学習基盤
    @sugasuga

    View Slide

  2. Profile
    sugasuga
    機械学習チームでエンジニア
    サブで採用・広報
    最近 趣味 トレーニング

    View Slide

  3. 今日
    お話しすること

    View Slide

  4. 話すこと

    View Slide

  5. なぜ機械学習基盤が
    必要か?

    View Slide

  6. 活用されている場面
    違反検知
    レコメンド
    広告
    3D etc..

    View Slide

  7. トップページ@ pixiv

    View Slide

  8. 関連作品 @ pixiv

    View Slide

  9. レコメンド @ pixivFANBOX

    View Slide

  10. 他にも

    View Slide

  11. 1ヶ月間
    レコメンド表示件数 ?

    View Slide

  12. 110億!!

    View Slide

  13. 大規模データ
    投稿作品総数 1.3億件
    総登録ユーザ数 9,800万人
    月間レコメンド表示件数 110億件

    View Slide

  14. 課題
    大規模なデータ 効率的な処理
    機械学習サービス 展開 しやすさ
    効率的な開発

    View Slide

  15. 機械学習基盤
    について

    View Slide

  16. 1. GCPバッチ基盤

    View Slide

  17. 必要分だけリソース確保できる

    View Slide

  18. 例: レコメンドバッチ

    View Slide

  19. 大規模データを
    効率的に処理できるように
    なりました

    View Slide

  20. 2. リアルタイム推論基盤

    View Slide

  21. 数秒以内にレスポンスを返す

    View Slide

  22. 例:タグ おすすめ機能

    View Slide

  23. 機械学習サービスを
    展開しやすくなりました

    View Slide

  24. 3. ノートブック開発環境

    View Slide

  25. ノートブック開発環境

    View Slide

  26. 例:リソース選択が自由

    View Slide

  27. 効率的に開発が
    行えるようになりました

    View Slide

  28. 全部移行したわけで ないです
    紹介できていない既存 便利な仕組みも
    資産として活用しています

    View Slide

  29. 基盤で使われている
    技術

    View Slide

  30. ど ように
    インフラ管理を行うか?

    View Slide

  31. インフラ管理
    社内でノウハウあるしterraformで良さそう

    View Slide

  32. どうやって認証を行うか?

    View Slide

  33. 認証
    特定 アクセス み許可したい

    View Slide

  34. 認証
    IAPぴったりじゃん!!

    View Slide

  35. なんでGKEを
    使っている ?

    View Slide

  36. GKE 管理 大変
    でも、、
    ポータブルである必要があった
    一部 機能がCloud Runで 使えなかった

    View Slide

  37. ど ようにk8s
    マニフェストを
    管理しよう?

    View Slide

  38. Kubernetes
    大量 yamlファイルが爆誕

    View Slide

  39. Kubernetes
    kustomizeでDRYに環境管理!

    View Slide

  40. そ 他
    ● ワークフローツール 選定
    ● エラー通知(Sentry)・クラスタ監視(Datadog)
    ● CI&CD設定や軽量化
    ● CT(機械学習特有 継続的学習)について

    View Slide

  41. 運用してみて感じた
    メリデメ

    View Slide

  42. 運用してみた感じた
    メリット

    View Slide

  43. チーム内でプロジェクトが完結

    View Slide

  44. やれることが増える

    View Slide

  45. マネージドサービス
    固有 問題を避けやすい
    マネージドサービスに頼りすぎていない で、
    自分達で どうしようもないという問題を
    「少し」避けやすい

    View Slide

  46. 運用してみた感じた
    デメリット

    View Slide

  47. 機械学習領域に割く時間が減る

    View Slide

  48. オンボーディングコストが高い

    View Slide

  49. 基盤を作って良かったと感じ
    ています

    View Slide

  50. さいごに

    View Slide

  51. さいごに
    現在GCPで機械学習基盤を構築しています
    今後も、ユーザーやクリエイター ために、
    機械学習技術/基盤を活用していきます

    View Slide

  52. 他 取り組みについて

    View Slide