Upgrade to Pro — share decks privately, control downloads, hide ads and more …

Sansan DSOC を支える名刺データ分析基盤構築 / Construction of business card data analysis infrastructure

Sansan
March 02, 2020

Sansan DSOC を支える名刺データ分析基盤構築 / Construction of business card data analysis infrastructure

■イベント
データ分析基盤Developers Night #4 〜活用されるデータ基盤のつくり方〜https://techplay.jp/event/768641

■登壇概要 
タイトル:Sansan DSOC を支える名刺データ分析基盤構築
発表者: 
DSOC 研究開発部 Arc Group 千葉 祐大

▼Sansan Builders Box 

https://buildersbox.corp-sansan.com/

Sansan

March 02, 2020
Tweet

More Decks by Sansan

Other Decks in Technology

Transcript

  1. 1 千葉 祐大(Yuta Chiba) DSOC Data Direction Group データエンジニア 2013年

    3月 室蘭工業大学 工学部 情報工学科 卒業 2013年 4月 アクセンチュア 株式会社 入社 2015年 10月 JIG-SAW 株式会社 入社 2017年 4月 Sansan 株式会社 入社 Development Group 配属 2018年 4月 Data Direction Group 新設
  2. 2

  3. 分析基盤構築前の課題 (1/2) 9 - 利用時に本番影響を考慮する必要がある > 利用時の心理的障壁が大きい > 責任範囲の切り分けにコストが掛かる >

    大規模な集計クエリが遅い それまではプロダクトの本番用 DB へ直接アクセスしており、課題があった。
  4. Amazon Kinesis AWS Lambda Amazon DynamoDB ニアリアル同期基盤 データソース 14 ニアリアル同期データベース

    Kinesis + Lambda + DynamoDB を利用してニアリアル同期を実現。 Amazon EC2 Amazon RDS ポーリング ポスト トリガー ポスト
  5. ウィークリー同期データベース 15 ウィークリー同期データベース Glue + Lambda + S3 + Athena

    等を利用してウィークリー同期を実現。 AWS Glue Amazon Athena AWS Data Pipeline Amazon DynamoDB AWS Step Functions AWS Lambda Event (time-based) Amazon Simple Storage Service トリガー トリガー トリガー トリガー 取得・保存 取得 保存 ニアリアル同期基盤 取得