Slide 1

Slide 1 text

MACHINE LEARNING AT LINE TAKAHIRO YOSHINAGA, MACHINE LEARNING SOLUTION TEAM 2 APR. 21TH, 2022

Slide 2

Slide 2 text

Contents • Introduction of LINE • Structures (Organization, roles, and PJ formations) • Project Examples • Open Positions

Slide 3

Slide 3 text

INTRODUCTION OF LINE

Slide 4

Slide 4 text

On top of LINE Messenger Platform 2 BUSINESS DOMAINS

Slide 5

Slide 5 text

OUR FOCUSED AREAS 「⼤量のデータが⽇々⽣成される」事業領域に注⼒ (⾳声, NLP, OCR, 画像など、特定ドメインに特化した専⾨組織も存在)

Slide 6

Slide 6 text

Of ML Dept. MISSION STATEMENT 機械学習を通じた、LINEの様々なサービスの競争⼒・利益への貢献 Provide service competency and profit through ML solutions to various LINE services 機械学習に関するLINE社内での標準化・⺠主化の推進 Lead standardization/democratization process of ML use at scale across LINE (inc. group companies) together w/ other data-related teams/depts. 「⼤量のデータが⽇々⽣成される」事業領域に注⼒ (⾳声, NLP, OCR, 画像など、特定ドメインに特化した専⾨組織も存在)

Slide 7

Slide 7 text

As of Dec. 2021. LINE USER BASE Top-4 MAU (Japan, Taiwan, Thailand, Indonesia) 174 million (as of 2021/12) MAU (Japan) 90 million (as of 2021/12)

Slide 8

Slide 8 text

As a foundation of building ML App., ML System, and ML Platform LINE’S DATA PLATFORM LINEではどのようにサービス横断でのデータ活⽤を実現しているのか - LINE DEVELOPER DAY 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=11

Slide 9

Slide 9 text

Information Universe (IU) SCALE - LINE’S DATA PLATFORM CTO Keynote - LINE DEVELOPER DAY 2020 https://speakerdeck.com/line_devday2020/cto-keynote-line-developer-day-2020?slide=24

Slide 10

Slide 10 text

STRUCTURES ORGANIZATIONS, ROLES, AND PROJECT FORMATIONS

Slide 11

Slide 11 text

As of Apr. 21, 2022 ORGANIZATION STRUCTURE Data Engineering Center Data Science Center Data Management Dept. Data Platform Dept. Other Depts. And Task Forces ML Privacy Team ML Solution Dept. ML&DS Planning team Other Depts. And Task Forces Data Management Team Data Management Team Data Management Team Data Management Team Data Management Team Data Platform Team ML Solution Team 1 ML Development Team ML Solution Team 2 ML Infrastructure Team ML Platform Dept. DSP ML Team Data Science Depts. • ML Platform Dept. • 事業横断的なPlatformを開発する組織 • ML Solution Dept. & ML&DS Planning team • 各事業と連携してMLの利活⽤を推進する組織

Slide 12

Slide 12 text

As of Apr. 21, 2022 TEAMS Data Engineering Center Data Science Center Other Depts. And Task Forces ML Privacy Team ML Solution Dept. ML&DS Planning team Other Depts. And Task Forces ML Solution Team 1 ML Development Team ML Solution Team 2 ML Infrastructure Team ML Platform Dept. DSP ML Team ML (and DS) Project & Product Management Recommender services, Demae-can, Image processing OA Optimization/Recommendation, User Persona / Feature Vector, LINE Music Ad Optimization (e.g. CTR prediction, etc.) ML R&D Activities (Diff. Privacy, Federated Learning, etc.) Recommender systems, ML Libraries, ML platform development, etc. ML infrastructure / platform design and DevOps • 2022/4/21現在で約40名が所属

Slide 13

Slide 13 text

COLLABORATORS Service Developers Data Scientists ML Platform Dept. Platform Developers ML Sol. Dept. Service Planners Data Scientists, ML Engineers (modeler)

Slide 14

Slide 14 text

Service Developers Data Scientists ML Platform Dept. Platform Developers ML Sol. Dept. Service Planners Data Scientists, ML Engineers CLIENT / USER

Slide 15

Slide 15 text

ROLES Service Developers Data Scientists Platform Developers Service Planners Data Scientists, ML Engineers ML Engineers (Platform-oriented) Server-side Engineers ML Engineers (Service-oriented) PM DevOps Engineers

Slide 16

Slide 16 text

PROJECT FORMATION サービス向けの MLエンジン開発 ML (system) ML (solution) PjM, PdM Server-side DevOps ML (system) PjM, PdM Server-side DevOps ML (system) ML (solution) PjM, PdM MLモデルの 汎⽤化など MLの周辺システム開発 (A/Bテストシステム開発, etc.) 汎⽤の MLシステム開発〜横展開 Server-side DevOps ML (solution) PjM, PdM Data Scientists (Platform Developers) Platform Developers, (Data Scientists) (Data Scientists)

Slide 17

Slide 17 text

PROJECT EXAMPLES

Slide 18

Slide 18 text

サービス横断系ML - SMART CHANNEL • トークリスト上部にコンテンツ・広告を表⽰ • 2段構成で、ML室は下記の両⽅を提供 1. 個別サービスのコンテンツ向けターゲティングロジック (様々な組織が供給) 2. 最終的にコンテンツ or 広告を1つ選定 LINEではどのようにサービス横断でのデータ活⽤を実現しているのか - LINE DEVELOPER DAY 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=21 100 individual targeting logics for 1. 600k+ uniq. items / day 1B+ imps. / day

Slide 19

Slide 19 text

サービス横断系ML - FEATURE STORE • 事業横断でML向けのデータを整備し、社内の他ML組織に提供 • 表現学習により、密ベクトル化したデータなども作成 LINEではどのようにサービス横断でのデータ活⽤を実現しているのか - LINE DEVELOPER DAY 2020 https://speakerdeck.com/line_devday2020/how-does-line-implement-cross-service-data-utilization?slide=16 45 data types 3.6K dim. 960M users 45 data types 60M+ dim. 960M users

Slide 20

Slide 20 text

サービス向けML - 出前館 offer/assign orders pick up order driver user merchant deliver Demaecan order Upgrading the Food Delivery Service Using Machine Learning - LINE DEVELOPER DAY 2021 https://speakerdeck.com/line_devday2021/upgrading-the-food-delivery-service-using-machine-learning recommendation preparation time prediction shop arrival time prediction order dispatch order forecast

Slide 21

Slide 21 text

サービス向けML - LINEスタンプ • -1000万 Items (global) • -100 items / user • x億 Users total (global) DATA VOLUME • Batch Recommendation (後述) による 共通的なML pipelineを⽤いて複数国家・ 種類のスタンプの推薦を提供 • Client sideでのMLにも挑戦中

Slide 22

Slide 22 text

サービス向けML - LINE公式アカウント Home tab Profile Talkhead Talkroom Preview User2item JP User2item JP/TW Ranking • LINEアプリの主要なメディアでLINE公式アカウント推薦 • Batch Recommendation (後述) による共通的なML pipelineを利⽤して提供範囲の拡⼤検討中

Slide 23

Slide 23 text

ML PLATFORM - BATCH RECOMMENDATION • 背後の基盤・リソースを意識せずに共通のフォーマットで機械学習モデルの開発・運⽤が可能 • ML組織以外への外部提供も推進中

Slide 24

Slide 24 text

OPEN POSITIONS

Slide 25

Slide 25 text

プラットフォーム開発・事業応⽤を通じてLINEのサービスを良くしていきたい⼈を求めています! We are hiring! ML Engineer ML Engineer (Ad) Project Manager ML Server-side Engineer DevOps Engineer https://linecorp.com/ja/ career/position/589 https://linecorp.com/ja/ career/position/3106 https://linecorp.com/ja/ career/position/3458 https://linecorp.com/ja/ career/position/1408 https://linecorp.com/ja/ career/position/2255 機械学習、コンピューターサ イエンス、数学の専⾨的な知 識 事業/ビジネスを理解した上 で、分析・提案ができること データの探索、特徴量の変換、 モデルの導出、システムの実 装、パフォーマンス評価の⼀ 通りの⾏程を Terabyte〜 Petabyte規模の⼤規模デー タで実施できるスキル 分散処理システム(Hadoop, Spark, MPI, etc.)の知識・ 経験 データ構造やアルゴリズムな どのコンピュータサイエンス の基礎知識 Python / Java / Scala / Go / Rust / C++ などのプログ ラム⾔語での開発経験(どれ か 1 つ以上) ソフトウェアシステムの開 発・構築経験 相⼿に応じた⾔語や表現で、 的確かつ端的、率直に伝えら れるコミュニケーション能⼒ 多様な関係者の主張や状況を 理解・整理しながら、議論を ファシリテートし、合意形成 をリードできる能⼒ プロジェクト全体を俯瞰し、 課題を⾒極め、率先して関係 者を巻き込んで解決し、プロ ジェクトを完了まで導くこと ができる能⼒ コンピューターサイエンスに 関する全般的な知識 何らかのサービス・プロジェ クトにおけるAPIやシステム の開発、および運⽤経験 分散処理システム(Hadoop, Spark, etc.)上でのデータ 加⼯、システムの実装、パ フォーマンス評価などの⾏程 をTerabyte〜Petabyte規模 の⼤規模データで実施できる スキル コンピューターサイエンスに 関する全般的な知識 Python/Java/Scala/Go/Rus t/C/C++ 等のプログラミン グ⾔語のうち、⼀つ以上の⾔ 語でコードを書けること CI/CDパイプラインの開発・ 運⽤経験 分散処理(Hadoop、Spark など)に関する開発・運⽤経 験

Slide 26

Slide 26 text

THANK YOU