Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
How Scala works at Mercari
Search
Sponsored
·
SiteGround - Reliable hosting with speed, security, and support you can count on.
→
Ryo Okubo
October 17, 2020
Programming
1.2k
2
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
How Scala works at Mercari
Ryo Okubo
October 17, 2020
More Decks by Ryo Okubo
See All by Ryo Okubo
気軽に使える"情報のハブ"としてのNotion活用 〜フロー情報の集積点 と、 Claude Code × Notion AI〜
syucream
1
200
UbieのAIパートナーを支えるコンテキストエンジニアリング実践
syucream
3
1.6k
メルカリ・メルペイの成長を支える データ基盤とはどんなものか
syucream
6
7.4k
バッチとストリーミング、それぞれの障害に立ち向かう
syucream
3
3.8k
Production-ready stream data pipeline in Merpay, Inc
syucream
2
13k
データとML周辺エンジニアリン グを考える会 #2 イントロ
syucream
0
680
マイクロサービスにおける ログ収集の課題と取り組み
syucream
7
2.8k
Stream Data Pipeline for Microservices in Merpay
syucream
6
1.3k
メルペイにおける、マイクロサービスに寄り添うログ収集基盤 / Microservices-frendly Data Pipeline
syucream
0
18k
Other Decks in Programming
See All in Programming
AI 時代のソフトウェア設計の学び方
masuda220
PRO
29
13k
ランチタイムLT会3周年!ランチタイムLT会を3年間続けられたお話
y0hgi
1
110
AIだと陥りがちなJakarta EE最新技術への移行時の落とし穴と解決策
tnagao7
0
120
代数的データ型って何が嬉しいの? #frontend_phpcon_do
kajitack
8
3.8k
気圧・高度・GPSを記録&可視化するアプリ「Koudo」を作った話
hjmkth
1
320
Skillsは効率化、Agentsは"自分の拡張"——Builder時代のエージェント編成(CC Night 2026)
wemra
1
160
TypeScript+Orvalで実現する型安全かつ堅牢でスケーラブルなマルチチャネル通知基盤 / TSKaigi Night talks ~after conference~
d0riven
0
360
Mujeres en SEO Summit 2026 - Greatest Disaster Hits en Web Performance
guaca
0
200
ふつうのFeature Flag実践入門
irof
8
4.2k
Javaの型とAI時代に型が大事な理由 / java types and type in AI era
kishida
2
150
キャリア迷子上等 ─ "ない道"は自分で作ればいい
16bitidol
3
2.3k
コンテキストの使い捨てをやめる — ビジネスルール駆動開発と miko —
ioki
0
230
Featured
See All Featured
Discover your Explorer Soul
emna__ayadi
2
1.1k
Mind Mapping
helmedeiros
PRO
1
260
Measuring & Analyzing Core Web Vitals
bluesmoon
9
870
How People are Using Generative and Agentic AI to Supercharge Their Products, Projects, Services and Value Streams Today
helenjbeal
1
220
Optimising Largest Contentful Paint
csswizardry
37
3.7k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
170
4 Signs Your Business is Dying
shpigford
187
22k
Designing for Timeless Needs
cassininazir
1
260
Balancing Empowerment & Direction
lara
6
1.2k
Visual Storytelling: How to be a Superhuman Communicator
reverentgeek
2
570
AI: The stuff that nobody shows you
jnunemaker
PRO
8
730
Making Projects Easy
brettharned
120
6.7k
Transcript
1 Scala がメルカリでどう動くか? ScalaMatsuri 2020 LT slides
2 メルカリとは •サービス開始日:2013年7月 •対応OS:Android、iOS ※Webブラウザからも利用可能 •利用料:無料 ※売れたときの手数料:販売価格の 10% •対応地域・言語:日本・日本語基本仕様
•累計出品数:15億品を突破 それを必要とする人の手に渡り、使用されることに喜びを感じ、ま た購入者は、多彩かつユニークな商品の中から「宝探し」感覚で 掘り出し物を見つける買い物体験を楽しんでいます。さらに「メル カリ」では、物の売買だけではなく、出品者・購入者間のチャットや 「いいね!」機能を通じて、お客さま間のコミュニケーションも活発 に行われています。 フリマアプリ「メルカリ」は、個人が簡単に中古品の売買を行える CtoCマーケットプレイスです。出品者・購入者双方が、安全・安心 な取引を楽しんでいただけるサービスを目指し、「メルカリ」が一時 的に購入代金を預かるエスクロー決済を活用した取引環境の整 備や、簡単かつ手頃な価格の配送オプション、差別化されたユ ニークなお客さま体験を提供しています。多くの出品者は、自分に とって必要でなくなったモノが、 2
3 • 社外に発信している情報は Go が多め ◦ 実際にバックエンド API の実装言語は Go
が非常に多い • でも一部 Scala も使っているんです! ◦ 当 LT で事例紹介させてください! ◦ Ref. 我々の技術スタック: https://engineering.mercari.com/technology-stack/ メルカリと Scala … ?
4 • ビッグデータ処理ジョブ実装言語として ◦ Java の資産が多いデータ処理において ◦ Apache Spark, Apache
Flink ジョブの実装のため • Gatling による負荷テストシナリオ記述のため • その他 Java 代替として メルカリにおける Scala の用途
5 • kintone に蓄積されたデータを分析に利用したい • kintone Spark connector で kintone
のレコード取得部分を実装 事例1. Spark による Kintone -> BigQuery データ同期
6 • 大規模データ基盤では品質の担保が困難 ◦ 信頼できないデータ基盤では、そこから得られた分析結果も信頼できなくなる ◦ 目視でデータの中身を確認できるはずもない • Deequ; AWS
が公開するデータユニットテストフレームワーク ◦ Apache Spark を利用している、ので Spark のリッチな API を利用可能 ◦ よく使われるテスト項目をサポート ▪ 重複した値が含まれていないか? ▪ NULL が含まれていないか? ▪ 想定したパターン以外の値が含まれていないか? 事例2. Deequ を使ったデータ品質チェック
7 • より抽象化されたテストシナリオのサポートを構想(開発中) ◦ Spark, Scala の強力な表現能力は嬉しいが、みんなに実装しろと言うのは酷 ◦ YAML にテスト項目を羅列するといい感じに実行されて欲しい
事例2. Deequ を使ったデータ品質チェック
8 • Pub/Sub で配送されたログを永続化・配送 • Apache Flink の Scala API
を用いてジョブを実装 事例3. マイクロサービスのログ収集パイプライン
9 • Flink ジョブでニアリアルタイムで変換・配送(開発中) ◦ CRM(Customer Relationship Management) 関連用途特化のアプリを開発予定 事例3.
マイクロサービスのログのストリーミング処理
10 • MySQL の binlog を BigQuery に配送しニアリアルタイムで分析可能に ◦ ETL
ジョブで MySQL に巨大クエリを投げるより低負荷でデータ同期可能 ◦ 分析可能になるまでのリードタイムが減少し、不正検知などへの活用が期待できる • 変更ログ送信エージェントを Scala で実装 • 変更ログを BigQuery に insert する Flink ジョブも Scala 製 事例4. CDC(Change Data Capture) パイプライン
11 • Apache Beam ベースの実装言語にも Scala を一部使用 ◦ For e.g.
https://github.com/mercari/pubsubloader • データ処理から派生して、スキーマ管理ツールも Scala で一部実装 余談