Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LINE Machine Learning Dept, Data Science Center

7817a37f86a649081722e52270d2ba75?s=47 LINE
July 01, 2021

LINE Machine Learning Dept, Data Science Center

2021年7月1日に開催した「LINE Machine Learning室 採用説明会」にて
使用したMachine Learning室の紹介資料です。
https://line.connpass.com/event/215668/

7817a37f86a649081722e52270d2ba75?s=128

LINE

July 01, 2021
Tweet

Transcript

  1. MACHINE LEARNING DEPT., DATA SCIENCE CENTER HARUKAKIKUCHI 2021/07/01

  2. OVERVIEW

  3. On top of LINE Messenger Platform 2 BUSINESS DOMAINS コア事業

    戦略事業 広告 コンテンツ, etc. Fintech コマース AI
  4. OUR FOCUSED AREAS コア事業 戦略事業 広告 コンテンツ, etc. Fintech コマース

    AI 「大量のデータが日々生成される」事業領域に注力 (音声, NLP, OCR, 画像など、特定ドメインに特化した専門組織も存在)
  5. As a messenger platform LINE USER BASE Global MAU 189

    million (as of 2021/03) Top-4 MAU (Japan, Taiwan, Thailand, Indonesia) 169 million (as of 2021/03) DAU/MAU (Japan, Taiwan, Thailand, Indonesia) 80 percent (as of 2020/10)
  6. Information Universe (IU) SCALE - LINE’S DATA PLATFORM CTO Keynote

    - LINE Developer Day 2020 https://speakerdeck.com/line_devday2020/cto-keynote-line-developer-day-2020?slide=24
  7. As a foundation of building ML App., ML System, and

    ML Platform LINE’S DATA PLATFORM LINEではどのようにサービス横断でのデータ活用を実現しているのか - LINE Developer Day 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=11
  8. PROJECT EXAMPLES

  9. サービス横断系ML - SMART CHANNEL • トークリスト上部にコンテンツ・広告を表示 • 2段構成で、ML室は下記の両方を提供 1. 個別サービスのコンテンツ向けターゲティングロジック

    (様々な組織が供給) 2. 最終的にコンテンツ or 広告を1つ選定 LINEではどのようにサービス横断でのデータ活用を実現しているのか - LINE Developer Day 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=21 100 individual targeting logics for 1. 600k+ uniq. items / day 1B+ imps. / day
  10. サービス横断系ML - FEATURE STORE • 事業横断でML向けのデータを整備し、社内の他ML組織に提供 • 表現学習により、密ベクトル化したデータなども作成 LINEではどのようにサービス横断でのデータ活用を実現しているのか -

    LINE Developer Day 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=16 45 data types 3.6K dim. 960M users 45 data types 60M+ dim. 960M users
  11. STRUCTURES ROLES, PROJECT FORMATIONS, AND ORGANIZATION

  12. Around ML Dept. COLLABORATORS Service Planners Service Developers Data Scientists

    Machine Learning Department Platform Developers
  13. In ML Dept. ML DEPT. ROLES ML Engineers (Engineering-oriented) Server-side

    Engineers ML Engineers (Service-oriented) Product Managers Service Planners Service Developers Data Scientists Platform Developers Project Managers DevOps Engineers
  14. Multiple Roles in a Project PROJECT FORMATION サービス向けの MLエンジン開発 ML

    (system) ML (solution) PjM, PdM Srv.-side DevOps ML (system) PjM, PdM Srv.-side DevOps ML (system) ML (solution) PjM, PdM MLモデルの 汎用化など MLの周辺システム開発 (A/Bテストシステム開発, etc.) 汎用の MLシステム開発〜横展開 Srv.-side DevOps ML (solution) PjM, PdM
  15. As of Jul. 1st, 2021 TEAMS IN ML DEPT. •

    2021/7/1現在で約30+名がML室に所属
  16. Mainly covered in today’s event OPEN POSITIONS ML Engineer ML

    Engineer (Ad) ML Product Manager ML Project Manager ML Server-side Engineer DevOps Engineer https://linecorp.com/ja/ career/position/589 https://linecorp.com/ja/ career/position/3106 https://linecorp.com/ja/ career/position/1598 https://linecorp.com/ja/ career/position/1043 https://linecorp.com/ja/ career/position/1408 https://linecorp.com/ja/ career/position/2255 機械学習、コンピュー ターサイエンス、数学の 専門的な知識 事業/ビジネスを理解した 上で、分析・提案ができ ること データの探索、特徴量の 変換、モデルの導出、シ ステムの実装、パフォー マンス評価の一通りの行 程を Terabyte〜Petabyte 規模の大規模データで実 施できるスキル 分散処理システム (Hadoop, Spark, MPI, etc.)の知識・経験 データ構造やアルゴリズ ムなどのコンピュータサ イエンスの基礎知識 Python / Java / Scala / Go / Rust / C++ などの プログラム言語での開発 経験(どれか 1 つ以上) 機械学習エンジニアと協 働して業務を遂行するた めの、機械学習に関する 基本的知識 機械学習技術を用いた サービスの開発、または 開発管理の経験 事業/ビジネス・機械学習 技術を理解した上で、基 礎的な分析〜企画・提案 ができる能力 サービスの開発者やビジ ネス部門等の関係者と連 携し、スムーズに業務を 進めるためのコミュニ ケーション能力 コンピュータサイエンス 専攻 and/or ソフトウェ ア開発の経験 プロジェクトマネー ジャーやそれに準ずる職 務経験 サービスの開発者やビジ ネス部門等の関係者と連 携し、スムーズに業務を 進めるためのコミュニ ケーション能力 コンピューターサイエン スに関する全般的な知識 何らかのサービス・プロ ジェクトにおけるAPIやシ ステムの開発、および運 用経験 分散処理システム (Hadoop, Spark, etc.) 上でのデータ加工、シス テムの実装、パフォーマ ンス評価などの行程を Terabyte〜Petabyte規模 の大規模データで実施で きるスキル コンピューターサイエン スに関する全般的な知識 Python/Java/Scala/Go/ Rust/C/C++ 等のプログ ラミング言語のうち、一 つ以上の言語でコードを 書けること CI/CDパイプラインの開 発・運用経験 分散処理(Hadoop、 Sparkなど)に関する開 発・運用経験
  17. ML Engineer ML Engineer (Ad) ML Product Manager ML Project

    Manager ML Server-side Engineer DevOps Engineer https://linecorp.com/ja/ career/position/589 https://linecorp.com/ja/ career/position/3106 https://linecorp.com/ja/ career/position/1598 https://linecorp.com/ja/ career/position/1043 https://linecorp.com/ja/ career/position/1408 https://linecorp.com/ja/ career/position/2255 機械学習、コンピュー ターサイエンス、数学の 専門的な知識 事業/ビジネスを理解した 上で、分析・提案ができ ること データの探索、特徴量の 変換、モデルの導出、シ ステムの実装、パフォー マンス評価の一通りの行 程を Terabyte〜Petabyte 規模の大規模データで実 施できるスキル 分散処理システム (Hadoop, Spark, MPI, etc.)の知識・経験 データ構造やアルゴリズ ムなどのコンピュータサ イエンスの基礎知識 Python / Java / Scala / Go / Rust / C++ などの プログラム言語での開発 経験(どれか 1 つ以上) 機械学習エンジニアと協 働して業務を遂行するた めの、機械学習に関する 基本的知識 機械学習技術を用いた サービスの開発、または 開発管理の経験 事業/ビジネス・機械学習 技術を理解した上で、基 礎的な分析〜企画・提案 ができる能力 サービスの開発者やビジ ネス部門等の関係者と連 携し、スムーズに業務を 進めるためのコミュニ ケーション能力 コンピュータサイエンス 専攻 and/or ソフトウェ ア開発の経験 プロジェクトマネー ジャーやそれに準ずる職 務経験 サービスの開発者やビジ ネス部門等の関係者と連 携し、スムーズに業務を 進めるためのコミュニ ケーション能力 コンピューターサイエン スに関する全般的な知識 何らかのサービス・プロ ジェクトにおけるAPIやシ ステムの開発、および運 用経験 分散処理システム (Hadoop, Spark, etc.) 上でのデータ加工、シス テムの実装、パフォーマ ンス評価などの行程を Terabyte〜Petabyte規模 の大規模データで実施で きるスキル コンピューターサイエン スに関する全般的な知識 Python/Java/Scala/Go/ Rust/C/C++ 等のプログ ラミング言語のうち、一 つ以上の言語でコードを 書けること CI/CDパイプラインの開 発・運用経験 分散処理(Hadoop、 Sparkなど)に関する開 発・運用経験 Mainly covered in today’s event OPEN POSITIONS 本日の採用説明会では割愛
  18. THANK YOU