Upgrade to Pro — share decks privately, control downloads, hide ads and more …

LINE Machine Learning Dept, Data Science Center

LINE
July 01, 2021

LINE Machine Learning Dept, Data Science Center

2021年7月1日に開催した「LINE Machine Learning室 採用説明会」にて
使用したMachine Learning室の紹介資料です。
https://line.connpass.com/event/215668/

LINE

July 01, 2021
Tweet

More Decks by LINE

Other Decks in Technology

Transcript

  1. MACHINE LEARNING DEPT.,
    DATA SCIENCE CENTER
    HARUKAKIKUCHI
    2021/07/01

    View Slide

  2. OVERVIEW

    View Slide

  3. On top of LINE Messenger Platform
    2 BUSINESS DOMAINS
    コア事業 戦略事業
    広告
    コンテンツ, etc.
    Fintech
    コマース
    AI

    View Slide

  4. OUR FOCUSED AREAS
    コア事業 戦略事業
    広告
    コンテンツ, etc.
    Fintech
    コマース
    AI
    「大量のデータが日々生成される」事業領域に注力
    (音声, NLP, OCR, 画像など、特定ドメインに特化した専門組織も存在)

    View Slide

  5. As a messenger platform
    LINE USER BASE
    Global MAU
    189
    million
    (as of 2021/03)
    Top-4 MAU
    (Japan, Taiwan, Thailand, Indonesia)
    169
    million
    (as of 2021/03)
    DAU/MAU
    (Japan, Taiwan, Thailand, Indonesia)
    80
    percent
    (as of 2020/10)

    View Slide

  6. Information Universe (IU)
    SCALE - LINE’S DATA PLATFORM
    CTO Keynote - LINE Developer Day 2020
    https://speakerdeck.com/line_devday2020/cto-keynote-line-developer-day-2020?slide=24

    View Slide

  7. As a foundation of building ML App., ML System, and ML Platform
    LINE’S DATA PLATFORM
    LINEではどのようにサービス横断でのデータ活用を実現しているのか - LINE Developer Day 2020
    https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=11

    View Slide

  8. PROJECT EXAMPLES

    View Slide

  9. サービス横断系ML - SMART CHANNEL
    • トークリスト上部にコンテンツ・広告を表示
    • 2段構成で、ML室は下記の両方を提供
    1. 個別サービスのコンテンツ向けターゲティングロジック
    (様々な組織が供給)
    2. 最終的にコンテンツ or 広告を1つ選定
    LINEではどのようにサービス横断でのデータ活用を実現しているのか - LINE Developer Day 2020
    https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=21
    100 individual targeting logics for 1.
    600k+ uniq. items / day
    1B+ imps. / day

    View Slide

  10. サービス横断系ML - FEATURE STORE
    • 事業横断でML向けのデータを整備し、社内の他ML組織に提供
    • 表現学習により、密ベクトル化したデータなども作成
    LINEではどのようにサービス横断でのデータ活用を実現しているのか - LINE Developer Day 2020
    https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=16
    45 data types
    3.6K dim.
    960M users
    45 data types
    60M+ dim.
    960M users

    View Slide

  11. STRUCTURES
    ROLES, PROJECT FORMATIONS, AND ORGANIZATION

    View Slide

  12. Around ML Dept.
    COLLABORATORS
    Service Planners
    Service Developers
    Data Scientists
    Machine Learning
    Department
    Platform
    Developers

    View Slide

  13. In ML Dept.
    ML DEPT. ROLES
    ML
    Engineers
    (Engineering-oriented)
    Server-side
    Engineers
    ML
    Engineers
    (Service-oriented)
    Product
    Managers
    Service Planners
    Service Developers
    Data Scientists
    Platform
    Developers
    Project
    Managers
    DevOps
    Engineers

    View Slide

  14. Multiple Roles in a Project
    PROJECT FORMATION
    サービス向けの
    MLエンジン開発
    ML
    (system)
    ML
    (solution)
    PjM,
    PdM
    Srv.-side
    DevOps
    ML
    (system)
    PjM,
    PdM
    Srv.-side
    DevOps
    ML
    (system)
    ML
    (solution)
    PjM,
    PdM
    MLモデルの
    汎用化など
    MLの周辺システム開発
    (A/Bテストシステム開発, etc.)
    汎用の
    MLシステム開発〜横展開
    Srv.-side
    DevOps
    ML
    (solution)
    PjM,
    PdM

    View Slide

  15. As of Jul. 1st, 2021
    TEAMS IN ML DEPT.
    • 2021/7/1現在で約30+名がML室に所属

    View Slide

  16. Mainly covered in today’s event
    OPEN POSITIONS
    ML Engineer
    ML Engineer
    (Ad)
    ML Product
    Manager
    ML Project
    Manager
    ML Server-side
    Engineer
    DevOps
    Engineer
    https://linecorp.com/ja/
    career/position/589
    https://linecorp.com/ja/
    career/position/3106
    https://linecorp.com/ja/
    career/position/1598
    https://linecorp.com/ja/
    career/position/1043
    https://linecorp.com/ja/
    career/position/1408
    https://linecorp.com/ja/
    career/position/2255
    機械学習、コンピュー
    ターサイエンス、数学の
    専門的な知識
    事業/ビジネスを理解した
    上で、分析・提案ができ
    ること
    データの探索、特徴量の
    変換、モデルの導出、シ
    ステムの実装、パフォー
    マンス評価の一通りの行
    程を Terabyte〜Petabyte
    規模の大規模データで実
    施できるスキル
    分散処理システム
    (Hadoop, Spark, MPI,
    etc.)の知識・経験
    データ構造やアルゴリズ
    ムなどのコンピュータサ
    イエンスの基礎知識
    Python / Java / Scala /
    Go / Rust / C++ などの
    プログラム言語での開発
    経験(どれか 1 つ以上)
    機械学習エンジニアと協
    働して業務を遂行するた
    めの、機械学習に関する
    基本的知識
    機械学習技術を用いた
    サービスの開発、または
    開発管理の経験
    事業/ビジネス・機械学習
    技術を理解した上で、基
    礎的な分析〜企画・提案
    ができる能力
    サービスの開発者やビジ
    ネス部門等の関係者と連
    携し、スムーズに業務を
    進めるためのコミュニ
    ケーション能力
    コンピュータサイエンス
    専攻 and/or ソフトウェ
    ア開発の経験
    プロジェクトマネー
    ジャーやそれに準ずる職
    務経験
    サービスの開発者やビジ
    ネス部門等の関係者と連
    携し、スムーズに業務を
    進めるためのコミュニ
    ケーション能力
    コンピューターサイエン
    スに関する全般的な知識
    何らかのサービス・プロ
    ジェクトにおけるAPIやシ
    ステムの開発、および運
    用経験
    分散処理システム
    (Hadoop, Spark, etc.)
    上でのデータ加工、シス
    テムの実装、パフォーマ
    ンス評価などの行程を
    Terabyte〜Petabyte規模
    の大規模データで実施で
    きるスキル
    コンピューターサイエン
    スに関する全般的な知識
    Python/Java/Scala/Go/
    Rust/C/C++ 等のプログ
    ラミング言語のうち、一
    つ以上の言語でコードを
    書けること
    CI/CDパイプラインの開
    発・運用経験
    分散処理(Hadoop、
    Sparkなど)に関する開
    発・運用経験

    View Slide

  17. ML Engineer
    ML Engineer
    (Ad)
    ML Product
    Manager
    ML Project
    Manager
    ML Server-side
    Engineer
    DevOps
    Engineer
    https://linecorp.com/ja/
    career/position/589
    https://linecorp.com/ja/
    career/position/3106
    https://linecorp.com/ja/
    career/position/1598
    https://linecorp.com/ja/
    career/position/1043
    https://linecorp.com/ja/
    career/position/1408
    https://linecorp.com/ja/
    career/position/2255
    機械学習、コンピュー
    ターサイエンス、数学の
    専門的な知識
    事業/ビジネスを理解した
    上で、分析・提案ができ
    ること
    データの探索、特徴量の
    変換、モデルの導出、シ
    ステムの実装、パフォー
    マンス評価の一通りの行
    程を Terabyte〜Petabyte
    規模の大規模データで実
    施できるスキル
    分散処理システム
    (Hadoop, Spark, MPI,
    etc.)の知識・経験
    データ構造やアルゴリズ
    ムなどのコンピュータサ
    イエンスの基礎知識
    Python / Java / Scala /
    Go / Rust / C++ などの
    プログラム言語での開発
    経験(どれか 1 つ以上)
    機械学習エンジニアと協
    働して業務を遂行するた
    めの、機械学習に関する
    基本的知識
    機械学習技術を用いた
    サービスの開発、または
    開発管理の経験
    事業/ビジネス・機械学習
    技術を理解した上で、基
    礎的な分析〜企画・提案
    ができる能力
    サービスの開発者やビジ
    ネス部門等の関係者と連
    携し、スムーズに業務を
    進めるためのコミュニ
    ケーション能力
    コンピュータサイエンス
    専攻 and/or ソフトウェ
    ア開発の経験
    プロジェクトマネー
    ジャーやそれに準ずる職
    務経験
    サービスの開発者やビジ
    ネス部門等の関係者と連
    携し、スムーズに業務を
    進めるためのコミュニ
    ケーション能力
    コンピューターサイエン
    スに関する全般的な知識
    何らかのサービス・プロ
    ジェクトにおけるAPIやシ
    ステムの開発、および運
    用経験
    分散処理システム
    (Hadoop, Spark, etc.)
    上でのデータ加工、シス
    テムの実装、パフォーマ
    ンス評価などの行程を
    Terabyte〜Petabyte規模
    の大規模データで実施で
    きるスキル
    コンピューターサイエン
    スに関する全般的な知識
    Python/Java/Scala/Go/
    Rust/C/C++ 等のプログ
    ラミング言語のうち、一
    つ以上の言語でコードを
    書けること
    CI/CDパイプラインの開
    発・運用経験
    分散処理(Hadoop、
    Sparkなど)に関する開
    発・運用経験
    Mainly covered in today’s event
    OPEN POSITIONS
    本日の採用説明会では割愛

    View Slide

  18. THANK YOU

    View Slide