Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
Amazon Appflow で Salesforce to Snowflake へのデータロ...
Search
Miyamotok
September 22, 2022
Technology
0
600
Amazon Appflow で Salesforce to Snowflake へのデータローディング(EL)をやってみた / appflow-salesforce-snowflake-dataloading
2022/9/22 JAWS-UG TOHOKU
Miyamotok
September 22, 2022
Tweet
Share
More Decks by Miyamotok
See All by Miyamotok
[ELTツール×BigQuery] どのAPI使ってる?それぞれのAPIについて調べてみた / elttool-bigquery-which-api
miyamotok
0
560
ノーコード×分析基盤で複数データソースからのデータ収集を楽しようの話 / multi-saas-data-extract
miyamotok
0
380
Amazon Appflow で SaaS データ取込みを自動化してQuickSightで可視化してみた / appflow-salesforce-quicksight
miyamotok
0
5.7k
AWS Glue を試してみたら、カスタムコネクタのありがたさを感じたこと / awsglue-custom-connector
miyamotok
0
1.9k
最近使ったETL、ELTサービス(ツール)でデータ収集タスクについて考える / etl-elt-datacollect-task
miyamotok
1
3.1k
_CDataSync_SaaSデータのバックアップ_.pdf
miyamotok
0
1.2k
Other Decks in Technology
See All in Technology
React Server ComponentsでAPI不要の開発体験
polidog
PRO
1
360
サービスロボット最前線:ugoが挑むPhysical AI活用
kmatsuiugo
0
180
人を動かすことについて考える
ichimichi
2
240
AIは変更差分からユニットテスト_結合テスト_システムテストでテストすべきことが出せるのか?
mineo_matsuya
5
3k
生成AIによるソフトウェア開発の収束地点 - Hack Fes 2025
vaaaaanquish
35
16k
Mackerel in さくらのクラウド
cubicdaiya
1
390
広島発!スタートアップ開発の裏側
tsankyo
0
140
メルカリIBIS:AIが拓く次世代インシデント対応
0gm
2
490
夏休みWebアプリパフォーマンス相談室/web-app-performance-on-radio
hachi_eiji
1
280
20250818_KGX・One Hokkaidoコラボイベント
tohgeyukihiro
0
130
はじめての転職講座/The Guide of First Career Change
kwappa
5
4.5k
GCASアップデート(202506-202508)
techniczna
0
230
Featured
See All Featured
実際に使うSQLの書き方 徹底解説 / pgcon21j-tutorial
soudai
PRO
183
54k
Building Better People: How to give real-time feedback that sticks.
wjessup
367
19k
For a Future-Friendly Web
brad_frost
179
9.9k
Side Projects
sachag
455
43k
Java REST API Framework Comparison - PWX 2021
mraible
33
8.8k
4 Signs Your Business is Dying
shpigford
184
22k
How STYLIGHT went responsive
nonsquared
100
5.7k
Code Reviewing Like a Champion
maltzj
525
40k
It's Worth the Effort
3n
187
28k
Gamification - CAS2011
davidbonilla
81
5.4k
Being A Developer After 40
akosma
90
590k
"I'm Feeling Lucky" - Building Great Search Experiences for Today's Users (#IAC19)
danielanewman
229
22k
Transcript
Amazon Appflow で Salesforce to Snowflake へのデータ ローディング(EL)をやってみた JAWS-UG TOHOKU
- 東北で働くエンジニアでAWSを語る会 #jawsugtohoku 2022/09/22 CData Software Japan 宮本
Amazon Appflow で Salesforce to Snowflake へのデータ ローディング(EL)をやってみた が出来なかった話💦 JAWS-UG
TOHOKU - 東北で働くエンジニアでAWSを語る会 #jawsugtohoku 2022/09/22 CData Software Japan 宮本
先にお伝えします Salesforce の取引先情報をAppflowの簡単な設定でSnowflake にデータローディングするはずが、 Appflow側の設定か何かで出来ませんでした m(__)m
自己紹介 宮本 航太(@miyamon44) CData Software Japan 合同会社 →主にSaaSのAPIにSQLでアクセスできるコネクタや アプリケーションを開発・提供 プロダクトチーム
→データパイプライン関連の問い合わせやサポートを中心に日々 従事。他にはAWSなどのクラウドサービスと自社製品での検証 や技術ブログ、たまにコネクタ開発など色々
なぜAppflow でSalesforce → Snowflake連携を 試そうとしたのか?
仕事柄、こんな問い合わせを受けることがよくあるので・・ その1 「部門毎で管理してるデータ(SaaS,etc)を横断的に可視化したいです!」 「ごりごりのデータ分析基盤構築までは考えてないです!!」 ELTでCloudDWHとかに加工無しデータを持ってくるところからで良さそ うかなーー
仕事柄、こんな問い合わせを受けることがよくあります その2 「GAやFBAdsなどのマーケティング関連のデータを分析したいので、そろそろデータ分 析基盤を置きたいと考えています!」 「けど開発したくないしサーバーとかも管理したくないです!!」 SaaS 系のETLもしくはELTサービスが欲しいんだなーー
仕事柄、こんな問い合わせを受けることがよくあります その3 「Salesforce とかMarketo から顧客・リードデータをDWH上(Snowflake)で分析した いっす!」 「けどアドホックで良いのでなるべくお金を掛けないで実現したいっす!!」 API経由のデータだけどアドホックに簡単に取得できるサービスが欲しい のかな
振り返ると・・・ ELTでCloudDWHとかに加工無しデータを持ってくるところからで良さそ うかなーー SaaS 系のETLもしくはELTサービスが欲しいんだなーー API経由のデータだけどアドホックに簡単に取得できるサービスが欲しい のかな
Amazon Appflow でも良いんじゃない?
Amazon Appflow
Amazon Appflow is なに? SaaS データを中心としたデータ連携(転送?)サービス
データソースコネクタ 結構ニーズがありそうなコネクタが揃っている! (個人的には汎用系コネクタあるとなお嬉しかった)
ディスティネーションコネクタ SaaS → S3 というパターンから、 SaaS → Cloud DWH SaaS
→ SaaS までもできる 例えば、、、 Zendesk でチャット対応したユーザーの情報をSalesforce に 書き込む 例えば、、、 Salesforce、Marketo のユーザー情報をSnowflake で統合すると か
Amazon Appflow is ETLか? ELTか?
Amazon Appflow is ETLか? ELTか? ## ETL
Amazon Appflow is ETLか? ELTか? ## ELT
Amazon Appflow is ETLか? ELTか? ## ELT
Amazon Appflow is ETLか? ELTか? Appflow内で行える変換機能 - データソースと同期先のフィールドマッピング - 取込みデータの妥当性
- フィルター条件 - 追加フィールドの取込み - 値のマスキング、文字列の切り捨て設定 ※Salesforceの場合は削除レコードの扱いを設定できた 基本的にはデータをそのまま送信先に転送するELTサービス
Salesforce → Snowflake を試してみた (冒頭でもお伝えしましたが) Salesforce の取引先情報をSnowflake に変換なしでそのまま連携。 構成はこんなシンプルな感じに自動連携を。
Salesforce → Snowflake を試してみた ちなみにAppflow のSnowflake への接続設定を確認すると、間に外部ステージとして S3 を挟むこ とがわかった
Salesforce の接続設定 OAuth での認証で接続
Snowflake の接続設定 Snowflake 側から参照するS3へのパスを設定したときのステージ名を 入力する <DB>.<スキーマ名>.<ステージ名>
接続エラー Snowflake からはCOPYコマンドでデータを取得することはできてるものの、 Appflow からはいろいろ試したもの の接続できず、、、 頼みの綱のログも出なかったので万事休す、、、 誰かこのエラーの対処方法わかる方いたら教えてホシイデス・・・_ | ̄|◦
仕切り直しで構成変更 (ノーコード感は薄くなるが…) Salesforce から S3 にデータをCSV出力し、それを定期的に Snowflake の COPYコマンドで取得 する方法に切り替え
S3 への接続設定 オンデマンド、スケジュール実行が選べ る
Appflow のフローが作成完了
Appflow の実行 Appflow のフローが正常終了 - S3にフロー名のフォルダが作成される - 実行単位でフォルダが分けられる - 実行日時付きのファイルが作成される
Snowflake 側からS3 のデータを取りに行く Snowflake 側でやること - 連携用テーブル作成 - COPYコマンドを実行 -
COPYコマンドを実行するタスクをスケジューリング化
ようやく Snowflake 側にSalesforce のデータを定期的に取得することができました! ちなみに1度ロードしたS3のファイルは次回からは読まないようになってたのは 個人的な発見でした
まとめ - (色々ありましたが)ELTのデータローディング部分ではAppflow は手軽に試せる! 特にAPIを意識しているビジネスサイドの方におすすめ - Appflow のSnowflake 連携はきっと簡単なはず! しかし世の中の数人くらいは同じエラーに遭遇するかも?
- HTTPリクエストを指定できる汎用系コネクタか、DB系コネクタがあると嬉しい - ログ系がもう少し簡単に確認できると更に嬉しい 特にデータソースへの生のリクエストとレスポンスなど見れると安心
最後に エンジニアメンバー募集中です!! ビビッときた方!まずは気軽に話でもしてみませんか?? https://www.wantedly.com/companies/cd ata2/projects
Thank you!!