Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Appflow で Salesforce to Snowflake へのデータロ...
Search
Miyamotok
September 22, 2022
Technology
0
600
Amazon Appflow で Salesforce to Snowflake へのデータローディング(EL)をやってみた / appflow-salesforce-snowflake-dataloading
2022/9/22 JAWS-UG TOHOKU
Miyamotok
September 22, 2022
Tweet
Share
More Decks by Miyamotok
See All by Miyamotok
[ELTツール×BigQuery] どのAPI使ってる?それぞれのAPIについて調べてみた / elttool-bigquery-which-api
miyamotok
0
560
ノーコード×分析基盤で複数データソースからのデータ収集を楽しようの話 / multi-saas-data-extract
miyamotok
0
380
Amazon Appflow で SaaS データ取込みを自動化してQuickSightで可視化してみた / appflow-salesforce-quicksight
miyamotok
0
5.7k
AWS Glue を試してみたら、カスタムコネクタのありがたさを感じたこと / awsglue-custom-connector
miyamotok
0
2k
最近使ったETL、ELTサービス(ツール)でデータ収集タスクについて考える / etl-elt-datacollect-task
miyamotok
1
3.1k
_CDataSync_SaaSデータのバックアップ_.pdf
miyamotok
0
1.2k
Other Decks in Technology
See All in Technology
5分でカオスエンジニアリングを分かった気になろう
pandayumi
0
210
【実演版】カンファレンス登壇者・スタッフにこそ知ってほしいマイクの使い方 / 大吉祥寺.pm 2025
arthur1
1
720
KotlinConf 2025_イベントレポート
sony
1
110
ガチな登山用デバイスからこんにちは
halka
1
230
EncryptedSharedPreferences が deprecated になっちゃった!どうしよう! / Oh no! EncryptedSharedPreferences has been deprecated! What should I do?
yanzm
0
190
Flutterでキャッチしないエラーはどこに行く
taiju59
0
220
S3アクセス制御の設計ポイント
tommy0124
3
190
ZOZOマッチのアーキテクチャと技術構成
zozotech
PRO
3
1.5k
BPaaSにおける人と協働する前提のAIエージェント-AWS登壇資料
kentarofujii
0
130
Codeful Serverless / 一人運用でもやり抜く力
_kensh
7
370
開発者を支える Internal Developer Portal のイマとコレカラ / To-day and To-morrow of Internal Developer Portals: Supporting Developers
aoto
PRO
1
440
2025年になってもまだMySQLが好き
yoku0825
8
4.6k
Featured
See All Featured
Git: the NoSQL Database
bkeepers
PRO
431
66k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
8
920
Being A Developer After 40
akosma
90
590k
Become a Pro
speakerdeck
PRO
29
5.5k
What’s in a name? Adding method to the madness
productmarketing
PRO
23
3.7k
A Modern Web Designer's Workflow
chriscoyier
696
190k
The Art of Delivering Value - GDevCon NA Keynote
reverentgeek
15
1.6k
Intergalactic Javascript Robots from Outer Space
tanoku
272
27k
KATA
mclloyd
32
14k
Code Review Best Practice
trishagee
70
19k
Making Projects Easy
brettharned
117
6.4k
Facilitating Awesome Meetings
lara
55
6.5k
Transcript
Amazon Appflow で Salesforce to Snowflake へのデータ ローディング(EL)をやってみた JAWS-UG TOHOKU
- 東北で働くエンジニアでAWSを語る会 #jawsugtohoku 2022/09/22 CData Software Japan 宮本
Amazon Appflow で Salesforce to Snowflake へのデータ ローディング(EL)をやってみた が出来なかった話💦 JAWS-UG
TOHOKU - 東北で働くエンジニアでAWSを語る会 #jawsugtohoku 2022/09/22 CData Software Japan 宮本
先にお伝えします Salesforce の取引先情報をAppflowの簡単な設定でSnowflake にデータローディングするはずが、 Appflow側の設定か何かで出来ませんでした m(__)m
自己紹介 宮本 航太(@miyamon44) CData Software Japan 合同会社 →主にSaaSのAPIにSQLでアクセスできるコネクタや アプリケーションを開発・提供 プロダクトチーム
→データパイプライン関連の問い合わせやサポートを中心に日々 従事。他にはAWSなどのクラウドサービスと自社製品での検証 や技術ブログ、たまにコネクタ開発など色々
なぜAppflow でSalesforce → Snowflake連携を 試そうとしたのか?
仕事柄、こんな問い合わせを受けることがよくあるので・・ その1 「部門毎で管理してるデータ(SaaS,etc)を横断的に可視化したいです!」 「ごりごりのデータ分析基盤構築までは考えてないです!!」 ELTでCloudDWHとかに加工無しデータを持ってくるところからで良さそ うかなーー
仕事柄、こんな問い合わせを受けることがよくあります その2 「GAやFBAdsなどのマーケティング関連のデータを分析したいので、そろそろデータ分 析基盤を置きたいと考えています!」 「けど開発したくないしサーバーとかも管理したくないです!!」 SaaS 系のETLもしくはELTサービスが欲しいんだなーー
仕事柄、こんな問い合わせを受けることがよくあります その3 「Salesforce とかMarketo から顧客・リードデータをDWH上(Snowflake)で分析した いっす!」 「けどアドホックで良いのでなるべくお金を掛けないで実現したいっす!!」 API経由のデータだけどアドホックに簡単に取得できるサービスが欲しい のかな
振り返ると・・・ ELTでCloudDWHとかに加工無しデータを持ってくるところからで良さそ うかなーー SaaS 系のETLもしくはELTサービスが欲しいんだなーー API経由のデータだけどアドホックに簡単に取得できるサービスが欲しい のかな
Amazon Appflow でも良いんじゃない?
Amazon Appflow
Amazon Appflow is なに? SaaS データを中心としたデータ連携(転送?)サービス
データソースコネクタ 結構ニーズがありそうなコネクタが揃っている! (個人的には汎用系コネクタあるとなお嬉しかった)
ディスティネーションコネクタ SaaS → S3 というパターンから、 SaaS → Cloud DWH SaaS
→ SaaS までもできる 例えば、、、 Zendesk でチャット対応したユーザーの情報をSalesforce に 書き込む 例えば、、、 Salesforce、Marketo のユーザー情報をSnowflake で統合すると か
Amazon Appflow is ETLか? ELTか?
Amazon Appflow is ETLか? ELTか? ## ETL
Amazon Appflow is ETLか? ELTか? ## ELT
Amazon Appflow is ETLか? ELTか? ## ELT
Amazon Appflow is ETLか? ELTか? Appflow内で行える変換機能 - データソースと同期先のフィールドマッピング - 取込みデータの妥当性
- フィルター条件 - 追加フィールドの取込み - 値のマスキング、文字列の切り捨て設定 ※Salesforceの場合は削除レコードの扱いを設定できた 基本的にはデータをそのまま送信先に転送するELTサービス
Salesforce → Snowflake を試してみた (冒頭でもお伝えしましたが) Salesforce の取引先情報をSnowflake に変換なしでそのまま連携。 構成はこんなシンプルな感じに自動連携を。
Salesforce → Snowflake を試してみた ちなみにAppflow のSnowflake への接続設定を確認すると、間に外部ステージとして S3 を挟むこ とがわかった
Salesforce の接続設定 OAuth での認証で接続
Snowflake の接続設定 Snowflake 側から参照するS3へのパスを設定したときのステージ名を 入力する <DB>.<スキーマ名>.<ステージ名>
接続エラー Snowflake からはCOPYコマンドでデータを取得することはできてるものの、 Appflow からはいろいろ試したもの の接続できず、、、 頼みの綱のログも出なかったので万事休す、、、 誰かこのエラーの対処方法わかる方いたら教えてホシイデス・・・_ | ̄|◦
仕切り直しで構成変更 (ノーコード感は薄くなるが…) Salesforce から S3 にデータをCSV出力し、それを定期的に Snowflake の COPYコマンドで取得 する方法に切り替え
S3 への接続設定 オンデマンド、スケジュール実行が選べ る
Appflow のフローが作成完了
Appflow の実行 Appflow のフローが正常終了 - S3にフロー名のフォルダが作成される - 実行単位でフォルダが分けられる - 実行日時付きのファイルが作成される
Snowflake 側からS3 のデータを取りに行く Snowflake 側でやること - 連携用テーブル作成 - COPYコマンドを実行 -
COPYコマンドを実行するタスクをスケジューリング化
ようやく Snowflake 側にSalesforce のデータを定期的に取得することができました! ちなみに1度ロードしたS3のファイルは次回からは読まないようになってたのは 個人的な発見でした
まとめ - (色々ありましたが)ELTのデータローディング部分ではAppflow は手軽に試せる! 特にAPIを意識しているビジネスサイドの方におすすめ - Appflow のSnowflake 連携はきっと簡単なはず! しかし世の中の数人くらいは同じエラーに遭遇するかも?
- HTTPリクエストを指定できる汎用系コネクタか、DB系コネクタがあると嬉しい - ログ系がもう少し簡単に確認できると更に嬉しい 特にデータソースへの生のリクエストとレスポンスなど見れると安心
最後に エンジニアメンバー募集中です!! ビビッときた方!まずは気軽に話でもしてみませんか?? https://www.wantedly.com/companies/cd ata2/projects
Thank you!!