Slide 1

Slide 1 text

MACHINE LEARNING DEPT., DATA SCIENCE CENTER HARUKAKIKUCHI 2021/07/01

Slide 2

Slide 2 text

OVERVIEW

Slide 3

Slide 3 text

On top of LINE Messenger Platform 2 BUSINESS DOMAINS コア事業 戦略事業 広告 コンテンツ, etc. Fintech コマース AI

Slide 4

Slide 4 text

OUR FOCUSED AREAS コア事業 戦略事業 広告 コンテンツ, etc. Fintech コマース AI 「大量のデータが日々生成される」事業領域に注力 (音声, NLP, OCR, 画像など、特定ドメインに特化した専門組織も存在)

Slide 5

Slide 5 text

As a messenger platform LINE USER BASE Global MAU 189 million (as of 2021/03) Top-4 MAU (Japan, Taiwan, Thailand, Indonesia) 169 million (as of 2021/03) DAU/MAU (Japan, Taiwan, Thailand, Indonesia) 80 percent (as of 2020/10)

Slide 6

Slide 6 text

Information Universe (IU) SCALE - LINE’S DATA PLATFORM CTO Keynote - LINE Developer Day 2020 https://speakerdeck.com/line_devday2020/cto-keynote-line-developer-day-2020?slide=24

Slide 7

Slide 7 text

As a foundation of building ML App., ML System, and ML Platform LINE’S DATA PLATFORM LINEではどのようにサービス横断でのデータ活用を実現しているのか - LINE Developer Day 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=11

Slide 8

Slide 8 text

PROJECT EXAMPLES

Slide 9

Slide 9 text

サービス横断系ML - SMART CHANNEL • トークリスト上部にコンテンツ・広告を表示 • 2段構成で、ML室は下記の両方を提供 1. 個別サービスのコンテンツ向けターゲティングロジック (様々な組織が供給) 2. 最終的にコンテンツ or 広告を1つ選定 LINEではどのようにサービス横断でのデータ活用を実現しているのか - LINE Developer Day 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=21 100 individual targeting logics for 1. 600k+ uniq. items / day 1B+ imps. / day

Slide 10

Slide 10 text

サービス横断系ML - FEATURE STORE • 事業横断でML向けのデータを整備し、社内の他ML組織に提供 • 表現学習により、密ベクトル化したデータなども作成 LINEではどのようにサービス横断でのデータ活用を実現しているのか - LINE Developer Day 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=16 45 data types 3.6K dim. 960M users 45 data types 60M+ dim. 960M users

Slide 11

Slide 11 text

STRUCTURES ROLES, PROJECT FORMATIONS, AND ORGANIZATION

Slide 12

Slide 12 text

Around ML Dept. COLLABORATORS Service Planners Service Developers Data Scientists Machine Learning Department Platform Developers

Slide 13

Slide 13 text

In ML Dept. ML DEPT. ROLES ML Engineers (Engineering-oriented) Server-side Engineers ML Engineers (Service-oriented) Product Managers Service Planners Service Developers Data Scientists Platform Developers Project Managers DevOps Engineers

Slide 14

Slide 14 text

Multiple Roles in a Project PROJECT FORMATION サービス向けの MLエンジン開発 ML (system) ML (solution) PjM, PdM Srv.-side DevOps ML (system) PjM, PdM Srv.-side DevOps ML (system) ML (solution) PjM, PdM MLモデルの 汎用化など MLの周辺システム開発 (A/Bテストシステム開発, etc.) 汎用の MLシステム開発〜横展開 Srv.-side DevOps ML (solution) PjM, PdM

Slide 15

Slide 15 text

As of Jul. 1st, 2021 TEAMS IN ML DEPT. • 2021/7/1現在で約30+名がML室に所属

Slide 16

Slide 16 text

Mainly covered in today’s event OPEN POSITIONS ML Engineer ML Engineer (Ad) ML Product Manager ML Project Manager ML Server-side Engineer DevOps Engineer https://linecorp.com/ja/ career/position/589 https://linecorp.com/ja/ career/position/3106 https://linecorp.com/ja/ career/position/1598 https://linecorp.com/ja/ career/position/1043 https://linecorp.com/ja/ career/position/1408 https://linecorp.com/ja/ career/position/2255 機械学習、コンピュー ターサイエンス、数学の 専門的な知識 事業/ビジネスを理解した 上で、分析・提案ができ ること データの探索、特徴量の 変換、モデルの導出、シ ステムの実装、パフォー マンス評価の一通りの行 程を Terabyte〜Petabyte 規模の大規模データで実 施できるスキル 分散処理システム (Hadoop, Spark, MPI, etc.)の知識・経験 データ構造やアルゴリズ ムなどのコンピュータサ イエンスの基礎知識 Python / Java / Scala / Go / Rust / C++ などの プログラム言語での開発 経験(どれか 1 つ以上) 機械学習エンジニアと協 働して業務を遂行するた めの、機械学習に関する 基本的知識 機械学習技術を用いた サービスの開発、または 開発管理の経験 事業/ビジネス・機械学習 技術を理解した上で、基 礎的な分析〜企画・提案 ができる能力 サービスの開発者やビジ ネス部門等の関係者と連 携し、スムーズに業務を 進めるためのコミュニ ケーション能力 コンピュータサイエンス 専攻 and/or ソフトウェ ア開発の経験 プロジェクトマネー ジャーやそれに準ずる職 務経験 サービスの開発者やビジ ネス部門等の関係者と連 携し、スムーズに業務を 進めるためのコミュニ ケーション能力 コンピューターサイエン スに関する全般的な知識 何らかのサービス・プロ ジェクトにおけるAPIやシ ステムの開発、および運 用経験 分散処理システム (Hadoop, Spark, etc.) 上でのデータ加工、シス テムの実装、パフォーマ ンス評価などの行程を Terabyte〜Petabyte規模 の大規模データで実施で きるスキル コンピューターサイエン スに関する全般的な知識 Python/Java/Scala/Go/ Rust/C/C++ 等のプログ ラミング言語のうち、一 つ以上の言語でコードを 書けること CI/CDパイプラインの開 発・運用経験 分散処理(Hadoop、 Sparkなど)に関する開 発・運用経験

Slide 17

Slide 17 text

ML Engineer ML Engineer (Ad) ML Product Manager ML Project Manager ML Server-side Engineer DevOps Engineer https://linecorp.com/ja/ career/position/589 https://linecorp.com/ja/ career/position/3106 https://linecorp.com/ja/ career/position/1598 https://linecorp.com/ja/ career/position/1043 https://linecorp.com/ja/ career/position/1408 https://linecorp.com/ja/ career/position/2255 機械学習、コンピュー ターサイエンス、数学の 専門的な知識 事業/ビジネスを理解した 上で、分析・提案ができ ること データの探索、特徴量の 変換、モデルの導出、シ ステムの実装、パフォー マンス評価の一通りの行 程を Terabyte〜Petabyte 規模の大規模データで実 施できるスキル 分散処理システム (Hadoop, Spark, MPI, etc.)の知識・経験 データ構造やアルゴリズ ムなどのコンピュータサ イエンスの基礎知識 Python / Java / Scala / Go / Rust / C++ などの プログラム言語での開発 経験(どれか 1 つ以上) 機械学習エンジニアと協 働して業務を遂行するた めの、機械学習に関する 基本的知識 機械学習技術を用いた サービスの開発、または 開発管理の経験 事業/ビジネス・機械学習 技術を理解した上で、基 礎的な分析〜企画・提案 ができる能力 サービスの開発者やビジ ネス部門等の関係者と連 携し、スムーズに業務を 進めるためのコミュニ ケーション能力 コンピュータサイエンス 専攻 and/or ソフトウェ ア開発の経験 プロジェクトマネー ジャーやそれに準ずる職 務経験 サービスの開発者やビジ ネス部門等の関係者と連 携し、スムーズに業務を 進めるためのコミュニ ケーション能力 コンピューターサイエン スに関する全般的な知識 何らかのサービス・プロ ジェクトにおけるAPIやシ ステムの開発、および運 用経験 分散処理システム (Hadoop, Spark, etc.) 上でのデータ加工、シス テムの実装、パフォーマ ンス評価などの行程を Terabyte〜Petabyte規模 の大規模データで実施で きるスキル コンピューターサイエン スに関する全般的な知識 Python/Java/Scala/Go/ Rust/C/C++ 等のプログ ラミング言語のうち、一 つ以上の言語でコードを 書けること CI/CDパイプラインの開 発・運用経験 分散処理(Hadoop、 Sparkなど)に関する開 発・運用経験 Mainly covered in today’s event OPEN POSITIONS 本日の採用説明会では割愛

Slide 18

Slide 18 text

THANK YOU