ピクシブにおける機械学習基盤
by
sugakoji
Link
Embed
Share
Beginning
This slide
Copy link URL
Copy link URL
Copy iframe embed code
Copy iframe embed code
Copy javascript embed code
Copy javascript embed code
Share
Tweet
Share
Tweet
Slide 1
Slide 1 text
ピクシブにおける 機械学習基盤 sugasuga 1
Slide 2
Slide 2 text
自己紹介 2
Slide 3
Slide 3 text
sugasuga 3 所属:ピクシブ株式会社 仕事:機械学習チームでエンジニア サブで採用・広報 趣味:最近はトレーニング
Slide 4
Slide 4 text
ピクシブとは? 4 ● 約16サービス イラスト・マンガ・小説の SNS クリエイター支援 創作系メディア マンガ家支援 マンガサービス EC 3Dモデル作成 イラスト勉強 ネット百科事典 グッズ作成 3Dモデル 運用広告 マンガアプリ ドローツール 画像変換 小説サービス
Slide 5
Slide 5 text
機械学習チームの特徴 5 ● 幅広いタスクをチームで遂行
Slide 6
Slide 6 text
今日話す内容 6
Slide 7
Slide 7 text
主に3つ話します 7
Slide 8
Slide 8 text
伝えたいメッセージ 8
Slide 9
Slide 9 text
機械学習基盤の紹介 9
Slide 10
Slide 10 text
GCPバッチ基盤 10 ● GPU・CPUリソースを必要分だけ確保して学習を行う
Slide 11
Slide 11 text
GCPオンライン推論基盤 11 ● オンプレ環境と繋いで推論結果を返す
Slide 12
Slide 12 text
機械学習基盤の作成に 必要だった技術 12
Slide 13
Slide 13 text
インフラ管理 13 ● terraformを使って各種GCPリソースの作成ができる
Slide 14
Slide 14 text
インフラ管理 14 ● 実際のterraformファイル(一部)
Slide 15
Slide 15 text
インフラ管理 15 ● 作成するリソースたくさんある
Slide 16
Slide 16 text
GKE 16 ● 概念理解が必要
Slide 17
Slide 17 text
GKE 17 ● 実際のマニフェスト (kubernetes設定ファイル)
Slide 18
Slide 18 text
GKE 18 ● 環境管理をDRYに行えるkustomize
Slide 19
Slide 19 text
認証周り(推論基盤の場合) 19 ● IAP(リバースプロキシ) 使って特定のアクセスのみ許可
Slide 20
Slide 20 text
CI整備 20 ● コーディングスタイル統一・テスト・型チェック ○ python ■ flake8/black/isort/pytest/mypy ○ sql ■ sqlfluff
Slide 21
Slide 21 text
CD(推論基盤の場合) 21 ● デプロイの大体の流れ
Slide 22
Slide 22 text
CT(推論基盤の場合) 22
Slide 23
Slide 23 text
その他 23 ● ロギング ● エラー通知(Sentry)・クラスタ監視(Datadog) ● Docker Imageの軽量化 (マルチステージビルドやベースイメージの選定 ) ● CIの設定や軽量化(認証周り/キャッシュ) ● 料金削減(リソースのライフサイクル設定 & コンピューティングリソースの最適化 ) けっこう大変😇
Slide 24
Slide 24 text
作成・運用していく中で感じた基盤のデ メリット 24
Slide 25
Slide 25 text
最初の構築に時間がかかる 25 ● 数ヶ月かかった
Slide 26
Slide 26 text
アルゴリズムに割く時間が減る 26 ● トレードオフとなる
Slide 27
Slide 27 text
オンボーディングコストが高くなる 27 ● ゆっくり習得していただく想定
Slide 28
Slide 28 text
作成・運用していく中で感じた 基盤のメリット 28
Slide 29
Slide 29 text
手戻りや調整が少ない 29 ● 自チーム内でプロジェクトが完結する
Slide 30
Slide 30 text
やれることが増える 30
Slide 31
Slide 31 text
やれることが増える 31 ● 具体例
Slide 32
Slide 32 text
マネージドサービス起因の問題を踏みにくい 32 ● マネージドサービスに頼りすぎていないので、自分達ではどうしようも ないという問題を「少し」避けやすい
Slide 33
Slide 33 text
所感 33 いろんな仕組みの変遷を経て、GCP基盤を作るに至りました。 最初の基盤は小さく作ることをおすすめします。
Slide 34
Slide 34 text
まとめ 34
Slide 35
Slide 35 text
まとめ 35
Slide 36
Slide 36 text
最後に 36
Slide 37
Slide 37 text
弊社の取り組みについて 37 その他の事例など、社内ブログpixiv insideに掲載しております
Slide 38
Slide 38 text
積極採用中!!! 38 MLOps人材・機械学習アルゴリズム人材を募集しています ● アルバイト ● 新卒 ● 中途 ● 副業 (夜・休日での作業可) カジュアル面談も受け付けております!
Slide 39
Slide 39 text
ご清聴 ありがとうございました 39