Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Machine Learning at LINE

Machine Learning at LINE

吉永尊洸(LINE株式会社 Machine Learning Solution2チーム マネージャー)
データサイエンティスト・機械学習エンジニア 6社合同採用説明会での発表資料です
https://line.connpass.com/event/239945/

LINE Developers

April 21, 2022
Tweet

More Decks by LINE Developers

Other Decks in Technology

Transcript

  1. Contents • Introduction of LINE • Structures (Organization, roles, and

    PJ formations) • Project Examples • Open Positions
  2. Of ML Dept. MISSION STATEMENT 機械学習を通じた、LINEの様々なサービスの競争⼒・利益への貢献 Provide service competency and

    profit through ML solutions to various LINE services 機械学習に関するLINE社内での標準化・⺠主化の推進 Lead standardization/democratization process of ML use at scale across LINE (inc. group companies) together w/ other data-related teams/depts. 「⼤量のデータが⽇々⽣成される」事業領域に注⼒ (⾳声, NLP, OCR, 画像など、特定ドメインに特化した専⾨組織も存在)
  3. As of Dec. 2021. LINE USER BASE Top-4 MAU (Japan,

    Taiwan, Thailand, Indonesia) 174 million (as of 2021/12) MAU (Japan) 90 million (as of 2021/12)
  4. As a foundation of building ML App., ML System, and

    ML Platform LINE’S DATA PLATFORM LINEではどのようにサービス横断でのデータ活⽤を実現しているのか - LINE DEVELOPER DAY 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=11
  5. Information Universe (IU) SCALE - LINE’S DATA PLATFORM CTO Keynote

    - LINE DEVELOPER DAY 2020 https://speakerdeck.com/line_devday2020/cto-keynote-line-developer-day-2020?slide=24
  6. As of Apr. 21, 2022 ORGANIZATION STRUCTURE Data Engineering Center

    Data Science Center Data Management Dept. Data Platform Dept. Other Depts. And Task Forces ML Privacy Team ML Solution Dept. ML&DS Planning team Other Depts. And Task Forces Data Management Team Data Management Team Data Management Team Data Management Team Data Management Team Data Platform Team ML Solution Team 1 ML Development Team ML Solution Team 2 ML Infrastructure Team ML Platform Dept. DSP ML Team Data Science Depts. • ML Platform Dept. • 事業横断的なPlatformを開発する組織 • ML Solution Dept. & ML&DS Planning team • 各事業と連携してMLの利活⽤を推進する組織
  7. As of Apr. 21, 2022 TEAMS Data Engineering Center Data

    Science Center Other Depts. And Task Forces ML Privacy Team ML Solution Dept. ML&DS Planning team Other Depts. And Task Forces ML Solution Team 1 ML Development Team ML Solution Team 2 ML Infrastructure Team ML Platform Dept. DSP ML Team ML (and DS) Project & Product Management Recommender services, Demae-can, Image processing OA Optimization/Recommendation, User Persona / Feature Vector, LINE Music Ad Optimization (e.g. CTR prediction, etc.) ML R&D Activities (Diff. Privacy, Federated Learning, etc.) Recommender systems, ML Libraries, ML platform development, etc. ML infrastructure / platform design and DevOps • 2022/4/21現在で約40名が所属
  8. COLLABORATORS Service Developers Data Scientists ML Platform Dept. Platform Developers

    ML Sol. Dept. Service Planners Data Scientists, ML Engineers (modeler)
  9. Service Developers Data Scientists ML Platform Dept. Platform Developers ML

    Sol. Dept. Service Planners Data Scientists, ML Engineers CLIENT / USER
  10. ROLES Service Developers Data Scientists Platform Developers Service Planners Data

    Scientists, ML Engineers ML Engineers (Platform-oriented) Server-side Engineers ML Engineers (Service-oriented) PM DevOps Engineers
  11. PROJECT FORMATION サービス向けの MLエンジン開発 ML (system) ML (solution) PjM, PdM

    Server-side DevOps ML (system) PjM, PdM Server-side DevOps ML (system) ML (solution) PjM, PdM MLモデルの 汎⽤化など MLの周辺システム開発 (A/Bテストシステム開発, etc.) 汎⽤の MLシステム開発〜横展開 Server-side DevOps ML (solution) PjM, PdM Data Scientists (Platform Developers) Platform Developers, (Data Scientists) (Data Scientists)
  12. サービス横断系ML - SMART CHANNEL • トークリスト上部にコンテンツ・広告を表⽰ • 2段構成で、ML室は下記の両⽅を提供 1. 個別サービスのコンテンツ向けターゲティングロジック

    (様々な組織が供給) 2. 最終的にコンテンツ or 広告を1つ選定 LINEではどのようにサービス横断でのデータ活⽤を実現しているのか - LINE DEVELOPER DAY 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=21 100 individual targeting logics for 1. 600k+ uniq. items / day 1B+ imps. / day
  13. サービス横断系ML - FEATURE STORE • 事業横断でML向けのデータを整備し、社内の他ML組織に提供 • 表現学習により、密ベクトル化したデータなども作成 LINEではどのようにサービス横断でのデータ活⽤を実現しているのか -

    LINE DEVELOPER DAY 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=16 45 data types 3.6K dim. 960M users 45 data types 60M+ dim. 960M users
  14. サービス向けML - 出前館 offer/assign orders pick up order driver user

    merchant deliver Demaecan order Upgrading the Food Delivery Service Using Machine Learning - LINE DEVELOPER DAY 2021 https://speakerdeck.com/line_devday2021/upgrading-the-food-delivery-service-using-machine-learning recommendation preparation time prediction shop arrival time prediction order dispatch order forecast
  15. サービス向けML - LINEスタンプ • -1000万 Items (global) • -100 items

    / user • x億 Users total (global) DATA VOLUME • Batch Recommendation (後述) による 共通的なML pipelineを⽤いて複数国家・ 種類のスタンプの推薦を提供 • Client sideでのMLにも挑戦中
  16. サービス向けML - LINE公式アカウント Home tab Profile Talkhead Talkroom Preview User2item

    JP User2item JP/TW Ranking • LINEアプリの主要なメディアでLINE公式アカウント推薦 • Batch Recommendation (後述) による共通的なML pipelineを利⽤して提供範囲の拡⼤検討中
  17. プラットフォーム開発・事業応⽤を通じてLINEのサービスを良くしていきたい⼈を求めています! We are hiring! ML Engineer ML Engineer (Ad) Project

    Manager ML Server-side Engineer DevOps Engineer https://linecorp.com/ja/ career/position/589 https://linecorp.com/ja/ career/position/3106 https://linecorp.com/ja/ career/position/3458 https://linecorp.com/ja/ career/position/1408 https://linecorp.com/ja/ career/position/2255 機械学習、コンピューターサ イエンス、数学の専⾨的な知 識 事業/ビジネスを理解した上 で、分析・提案ができること データの探索、特徴量の変換、 モデルの導出、システムの実 装、パフォーマンス評価の⼀ 通りの⾏程を Terabyte〜 Petabyte規模の⼤規模デー タで実施できるスキル 分散処理システム(Hadoop, Spark, MPI, etc.)の知識・ 経験 データ構造やアルゴリズムな どのコンピュータサイエンス の基礎知識 Python / Java / Scala / Go / Rust / C++ などのプログ ラム⾔語での開発経験(どれ か 1 つ以上) ソフトウェアシステムの開 発・構築経験 相⼿に応じた⾔語や表現で、 的確かつ端的、率直に伝えら れるコミュニケーション能⼒ 多様な関係者の主張や状況を 理解・整理しながら、議論を ファシリテートし、合意形成 をリードできる能⼒ プロジェクト全体を俯瞰し、 課題を⾒極め、率先して関係 者を巻き込んで解決し、プロ ジェクトを完了まで導くこと ができる能⼒ コンピューターサイエンスに 関する全般的な知識 何らかのサービス・プロジェ クトにおけるAPIやシステム の開発、および運⽤経験 分散処理システム(Hadoop, Spark, etc.)上でのデータ 加⼯、システムの実装、パ フォーマンス評価などの⾏程 をTerabyte〜Petabyte規模 の⼤規模データで実施できる スキル コンピューターサイエンスに 関する全般的な知識 Python/Java/Scala/Go/Rus t/C/C++ 等のプログラミン グ⾔語のうち、⼀つ以上の⾔ 語でコードを書けること CI/CDパイプラインの開発・ 運⽤経験 分散処理(Hadoop、Spark など)に関する開発・運⽤経 験