Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Appflow で SaaS データ取込みを自動化してQuickSightで可視...
Search
Sponsored
·
Your Podcast. Everywhere. Effortlessly.
Share. Educate. Inspire. Entertain. You do you. We'll handle the rest.
→
Miyamotok
April 14, 2021
Technology
5.9k
0
Share
Amazon Appflow で SaaS データ取込みを自動化してQuickSightで可視化してみた / appflow-salesforce-quicksight
2021/4/14 JAWS-UG TOHOKU
Miyamotok
April 14, 2021
More Decks by Miyamotok
See All by Miyamotok
Amazon Appflow で Salesforce to Snowflake へのデータローディング(EL)をやってみた / appflow-salesforce-snowflake-dataloading
miyamotok
0
640
[ELTツール×BigQuery] どのAPI使ってる?それぞれのAPIについて調べてみた / elttool-bigquery-which-api
miyamotok
0
580
ノーコード×分析基盤で複数データソースからのデータ収集を楽しようの話 / multi-saas-data-extract
miyamotok
0
400
AWS Glue を試してみたら、カスタムコネクタのありがたさを感じたこと / awsglue-custom-connector
miyamotok
0
2k
最近使ったETL、ELTサービス(ツール)でデータ収集タスクについて考える / etl-elt-datacollect-task
miyamotok
1
3.3k
_CDataSync_SaaSデータのバックアップ_.pdf
miyamotok
0
1.2k
Other Decks in Technology
See All in Technology
OCI技術資料 : ロード・バランサ 概要 - FLB・NLB共通
ocise
4
27k
仕様通り動くの先へ。Claude Codeで「使える」を検証する
gotalab555
8
2.7k
推し活エージェント
yuntan_t
1
840
ハーネスエンジニアリング×AI適応開発
aictokamiya
3
1.5k
Kubernetes基盤における開発者体験 とセキュリティの両⽴ / Balancing developer experience and security in a Kubernetes-based environment
chmikata
0
200
AIにより大幅に強化された AWS Transform Customを触ってみる
0air
0
310
ZOZOTOWNリプレイスでのSkills導入までの流れとこれから
zozotech
PRO
4
2.8k
AWSで2番目にリリースされたサービスについてお話しします(諸説あります)
yama3133
0
120
2026-04-02 IBM Bobオンボーディング入門
yutanonaka
0
220
BIツール「Omni」の紹介 @Snowflake中部UG
sagara
0
210
JAWS DAYS 2026でAIの「もやっと」感が解消された話
smt7174
1
130
Oracle Cloud Infrastructure(OCI):Onboarding Session(はじめてのOCI/Oracle Supportご利⽤ガイド)
oracle4engineer
PRO
2
17k
Featured
See All Featured
How STYLIGHT went responsive
nonsquared
100
6k
Responsive Adventures: Dirty Tricks From The Dark Corners of Front-End
smashingmag
254
22k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.2k
Introduction to Domain-Driven Design and Collaborative software design
baasie
1
710
Testing 201, or: Great Expectations
jmmastey
46
8.1k
Jess Joyce - The Pitfalls of Following Frameworks
techseoconnect
PRO
1
120
How to optimise 3,500 product descriptions for ecommerce in one day using ChatGPT
katarinadahlin
PRO
1
3.5k
Skip the Path - Find Your Career Trail
mkilby
1
96
Paper Plane (Part 1)
katiecoart
PRO
0
6.4k
Code Review Best Practice
trishagee
74
20k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
91
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
16
1.9k
Transcript
Amazon AppFlow で SaaS データ取込みを自動化して QuickSightで可視化してみた JAWS-UG TOHOKU 2021/04/14 CData
Software Japan 宮本
Amazon AppFlow で SaaS データ取込みを自動化して QuickSightで可視化 Crawler AWS Glue Data
Catalog Amazon S3 Athena QuickSight AWS Glue 連携データ BackUp Amazon AppFlow
Me • CData Software Japan のエンジニア • 宮本 航太(@miyamon44) •
CData Sync (ELTツール) を年中触ってる人 • テクニカルサポート、開発、他社サービスとの検証も • ETL/ELT、データ仮想化というワードをウォッチ中 最近はAWS Glue、Athenaのカスタムコネクタ、S3Lambda あた りが気になってる
ノーコードデータ連携 Glue Studio Azure Data Factory Google Cloud Data Fusion
・ 海外、国内問わず GUI 上で完結できる(ノーコード)データ連携サービス・ツールは多くなってきてる ・ 最近では ELT と呼ばれるデータ転送を主とした方式がフォーカスされている ノーコード=アプリ開発というイメージが強いけど
データ連携:ETLのケース SaaS DB/S3 など データ抽出 変換 ロード DB
データ連携:ELTのケース SaaS データ抽出 変換 DB/S3 など ロード DB DWH:Redshift, BigQuery,
Snowflake, etc… データレイク(クラウドストレージ):S3、GCS, etc… 取得したデータを ほぼそのままロード ロード後に必要で あれば変換
データ連携:ELTのケース SaaS データ抽出 変換 DB/S3 など ロード DB DWH:Redshift, BigQuery,
Snowflake, etc… データレイク(クラウドストレージ):S3、GCS, etc… 取得したデータを ほぼそのままロード ロード後に必要で あれば変換
Amazon AppFlow
Amazon AppFlowでそれが簡単にできる https://aws.amazon.com/jp/appflow/faqs/ 公式サイトにて
いろいろなパターンの連携が可能 データ抽出 変換 ロード ・ 面倒なAPI仕様もあまり気にしなくても使える ・ SaaS → DWH/S3、
SaaS/File → SaaS がすぐできる Amazon Redshift Amazon AppFlow
この連携をやってみた データ抽出 変換 ロード SaaS to DWH、S3への転送に加え、SaaS to SaaS もできる!
Amazon Redshift
AppFlowで連携後の構成 Crawler AWS Glue Data Catalog Amazon S3 Athena QuickSight
AWS Glue テーブル作成するだけな ので初回だけ実行 連携データ BackUp Amazon AppFlow
Salesforce to S3 データソース、送信先の設定は選択形式 Salesforce ではイベントドリブンでジョブを実行できる 例)商談データが変更された、リードデータが変更されたなど
Salesforce to S3 (トリガー) 取込みを自動化したいのでスケジュール実行
Salesforce to S3 (変換) • データソースと同期先のフィールドマッピング • 取込みデータの妥当性 • フィルター条件
• 追加フィールドの取込み • 値のマスキング、文字列の切り捨て設定 ※Salesforceの場合は削除レコードの扱いを設定できた 以上で設定完了。すぐに始められる。 言い換えると、複雑なデータパイプラインは作成できない。
AWS Glue クローラー Glue でS3に格納したファイルをもとに推論でスキーマ情報をデータカタログに作成してくれる
AWS Glue クローラー こっちもGUI 上で選択するだけ。1回の実行でOK
AWS Glue クローラー 実行後、スキーマ情報を編集できる
Athena で連携データにクエリ これでAthena上でクエリできる。 →CTASで複数データソース(Salesforce と Marketoなど)を結合したテーブルを作成できる
スケジュール実行の場合、古いファイルは退避 複数回の連携でファイルの中身が重複してしまうので、既存ファイルはどこかに退避すると良い。 (AWS Batchなどで)
QuickSightで可視化 データソースにAthenaのテーブルを選択するだけ
QuickSightで可視化 データは準備できたので可視化するだけ
マルチデータソースでも同じ構成で可視化できる Crawler AWS Glue Data Catalog Amazon S3 Athena QuickSight
AWS Glue Amazon AppFlow
まとめ 1.SaaS APIのエンドポイントを熟知しなくても簡単にデータを抜き出せる 2.AppFlow + Glue クローラー + Athena +
QuickSight で、 SaaS データを可視化できる 3.データソースが変わっても同じ手法で利用できる α.SaaS への連携もできる!(CSV → Salesforce など)
Thank you!