Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
ピクシブにおける機械学習基盤
Search
sugakoji
June 13, 2023
Technology
760
0
Share
ピクシブにおける機械学習基盤
第31回MLOps 勉強会で発表を行った「ピクシブ株式会社における機械学習基盤」の資料になります。
sugakoji
June 13, 2023
More Decks by sugakoji
See All by sugakoji
ピクシブの機械学習基盤 (PIXIV MEETUP 2023版)
sugakoji
0
1.6k
Other Decks in Technology
See All in Technology
20260507-ACL-seminar
satoshi5884
0
110
Every Conversation Counts
kawaguti
PRO
0
200
Oracle Cloud Infrastructure presents managed, serverless MCP Servers for Oracle AI Database
thatjeffsmith
0
220
AI時代に、 データアナリストがデータエンジニアに異動して
jackojacko_
0
640
古今東西SRE
okaru
2
180
エージェント時代の UIとAPI、CLI戦略
coincheck_recruit
0
170
大学職員のための生成AI最前線 :最前線を、AIガバナンスとして読み直すためのTips
gmoriki
2
3.9k
AI駆動開発で生産性を追いかけたら、行き着いたのは品質とシフトレフトだった
littlehands
0
470
AIが盛んな時代に 技術記事を書き始めて起きた私の中での小さな変化
peintangos
0
370
PdM・Eng・QAで進めるAI駆動開発の現在地/aidd-with-pdm-eng-qa
shota_kusaba
0
180
AIと乗り切った1,500ページ超のヘルプサイト基盤刷新とさらにその先の話
mugi_uno
2
330
ボトムアップの改善の火を灯し続けろ!〜支援現場で学んだ、消えないための3つの打ち手〜 / 20260509 Kazuki Mori
shift_evolve
PRO
2
620
Featured
See All Featured
Practical Orchestrator
shlominoach
191
11k
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
180
How to Create Impact in a Changing Tech Landscape [PerfNow 2023]
tammyeverts
55
3.3k
Chrome DevTools: State of the Union 2024 - Debugging React & Beyond
addyosmani
10
1.2k
Why Your Marketing Sucks and What You Can Do About It - Sophie Logan
marketingsoph
0
140
Mobile First: as difficult as doing things right
swwweet
225
10k
The SEO identity crisis: Don't let AI make you average
varn
0
460
Mind Mapping
helmedeiros
PRO
1
190
The Illustrated Children's Guide to Kubernetes
chrisshort
51
52k
The Web Performance Landscape in 2024 [PerfNow 2024]
tammyeverts
12
1.1k
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.6k
RailsConf & Balkan Ruby 2019: The Past, Present, and Future of Rails at GitHub
eileencodes
141
35k
Transcript
ピクシブにおける 機械学習基盤 sugasuga 1
自己紹介 2
sugasuga 3 所属:ピクシブ株式会社 仕事:機械学習チームでエンジニア サブで採用・広報 趣味:最近はトレーニング
ピクシブとは? 4 • 約16サービス イラスト・マンガ・小説の SNS クリエイター支援 創作系メディア マンガ家支援 マンガサービス
EC 3Dモデル作成 イラスト勉強 ネット百科事典 グッズ作成 3Dモデル 運用広告 マンガアプリ ドローツール 画像変換 小説サービス
機械学習チームの特徴 5 • 幅広いタスクをチームで遂行
今日話す内容 6
主に3つ話します 7
伝えたいメッセージ 8
機械学習基盤の紹介 9
GCPバッチ基盤 10 • GPU・CPUリソースを必要分だけ確保して学習を行う
GCPオンライン推論基盤 11 • オンプレ環境と繋いで推論結果を返す
機械学習基盤の作成に 必要だった技術 12
インフラ管理 13 • terraformを使って各種GCPリソースの作成ができる
インフラ管理 14 • 実際のterraformファイル(一部)
インフラ管理 15 • 作成するリソースたくさんある
GKE 16 • 概念理解が必要
GKE 17 • 実際のマニフェスト (kubernetes設定ファイル)
GKE 18 • 環境管理をDRYに行えるkustomize
認証周り(推論基盤の場合) 19 • IAP(リバースプロキシ) 使って特定のアクセスのみ許可
CI整備 20 • コーディングスタイル統一・テスト・型チェック ◦ python ▪ flake8/black/isort/pytest/mypy ◦ sql
▪ sqlfluff
CD(推論基盤の場合) 21 • デプロイの大体の流れ
CT(推論基盤の場合) 22
その他 23 • ロギング • エラー通知(Sentry)・クラスタ監視(Datadog) • Docker Imageの軽量化 (マルチステージビルドやベースイメージの選定
) • CIの設定や軽量化(認証周り/キャッシュ) • 料金削減(リソースのライフサイクル設定 & コンピューティングリソースの最適化 ) けっこう大変😇
作成・運用していく中で感じた基盤のデ メリット 24
最初の構築に時間がかかる 25 • 数ヶ月かかった
アルゴリズムに割く時間が減る 26 • トレードオフとなる
オンボーディングコストが高くなる 27 • ゆっくり習得していただく想定
作成・運用していく中で感じた 基盤のメリット 28
手戻りや調整が少ない 29 • 自チーム内でプロジェクトが完結する
やれることが増える 30
やれることが増える 31 • 具体例
マネージドサービス起因の問題を踏みにくい 32 • マネージドサービスに頼りすぎていないので、自分達ではどうしようも ないという問題を「少し」避けやすい
所感 33 いろんな仕組みの変遷を経て、GCP基盤を作るに至りました。 最初の基盤は小さく作ることをおすすめします。
まとめ 34
まとめ 35
最後に 36
弊社の取り組みについて 37 その他の事例など、社内ブログpixiv insideに掲載しております
積極採用中!!! 38 MLOps人材・機械学習アルゴリズム人材を募集しています • アルバイト • 新卒 • 中途 •
副業 (夜・休日での作業可) カジュアル面談も受け付けております!
ご清聴 ありがとうございました 39