Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
AWS Glue を試してみたら、カスタムコネクタのありがたさを感じたこと / awsglue...
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
Miyamotok
February 24, 2021
Technology
2k
0
Share
AWS Glue を試してみたら、カスタムコネクタのありがたさを感じたこと / awsglue-custom-connector
2021/2/24 JAWS-UG TOHOKU
Miyamotok
February 24, 2021
More Decks by Miyamotok
See All by Miyamotok
Amazon Appflow で Salesforce to Snowflake へのデータローディング(EL)をやってみた / appflow-salesforce-snowflake-dataloading
miyamotok
0
660
[ELTツール×BigQuery] どのAPI使ってる?それぞれのAPIについて調べてみた / elttool-bigquery-which-api
miyamotok
0
590
ノーコード×分析基盤で複数データソースからのデータ収集を楽しようの話 / multi-saas-data-extract
miyamotok
0
400
Amazon Appflow で SaaS データ取込みを自動化してQuickSightで可視化してみた / appflow-salesforce-quicksight
miyamotok
0
6k
最近使ったETL、ELTサービス(ツール)でデータ収集タスクについて考える / etl-elt-datacollect-task
miyamotok
1
3.3k
_CDataSync_SaaSデータのバックアップ_.pdf
miyamotok
0
1.3k
Other Decks in Technology
See All in Technology
VespaのParent Childを用いたフィードパフォーマンスの改善
taking
0
260
[Oracle TechNight#99] 生成AI時代のAI/ML入門 ~ AIとオラクルデータベースの関係 (後半)
oracle4engineer
PRO
3
230
Databricks Academic Series 〜 大規模言語モデル / エージェント編 〜 / academic-series-llm
databricksjapan
0
100
需要創出(Chatwork)×供給(BPaaS) フライホイールとMoat 実行能力の最適配置とAI戦略
kubell_hr
0
2k
独断と偏見で試してみる、 シングル or マルチエージェント どっちがいいの?
shichijoyuhi
1
240
「誰一人取り残されない」 AIエージェント時代のプロダクト設計思想 Product Management Summit 2026
mizushimac
1
2.9k
フロントエンドの相手が変わった - AIが加わったWebの新しいインターフェース設計
azukiazusa1
33
10k
Forget technical debt
ufried
0
170
Google Cloud Next '26 の裏でこっそりリリースされたCloud Number Registry & Cloud Hub コスト分析 を試してみた
hikaru1001
0
160
FessのAI検索モード:検索システムとLLMへの取り組み
marevol
0
270
『生成AI時代のクレデンシャルとパーミッション設計 — Claude Code を起点に』の執筆企画
takuros
2
2.1k
Oracle Exadata Database Service on Cloud@Customer X11M (ExaDB-C@C) サービス概要
oracle4engineer
PRO
2
7.9k
Featured
See All Featured
世界の人気アプリ100個を分析して見えたペイウォール設計の心得
akihiro_kokubo
PRO
70
39k
ピンチをチャンスに:未来をつくるプロダクトロードマップ #pmconf2020
aki_iinuma
128
55k
Raft: Consensus for Rubyists
vanstee
141
7.4k
The Cult of Friendly URLs
andyhume
79
6.9k
The State of eCommerce SEO: How to Win in Today's Products SERPs - #SEOweek
aleyda
2
10k
Mozcon NYC 2025: Stop Losing SEO Traffic
samtorres
0
220
The untapped power of vector embeddings
frankvandijk
2
1.7k
How Software Deployment tools have changed in the past 20 years
geshan
0
33k
Evolution of real-time – Irina Nazarova, EuRuKo, 2024
irinanazarova
9
1.3k
16th Malabo Montpellier Forum Presentation
akademiya2063
PRO
0
110
Efficient Content Optimization with Google Search Console & Apps Script
katarinadahlin
PRO
1
530
XXLCSS - How to scale CSS and keep your sanity
sugarenia
250
1.3M
Transcript
AWS Glue を試してみたら、カ スタムコネクタのありがたさを 感じたこと JAWS-UG TOHOKU 2021/02/24 CData Software
Japan 宮本
自己紹介 宮本 航太(@miyamon44) CData Software Japan 合同会社 CData Syncを年中触ってる人 普段は製品サポートを中心に、開発、他社サービスと
の検証 これからAWSと仲良しになりたいので、 今はお気に入りになりそうなサービスを調査中
CData Glue Connectors Release!!
リリースするのは知っていたけど・・・ ぐるー? 名前は聞いたこと あるけど?
ちょっと調べてみた 公式ページより、 ‘‘分析、機械学習、アプリケーション開発のためのデータの検出、準備、結 合を簡単に行える、サーバーレスデータ統合サービス’’ AWS上のETLサービス データパイプラインの作成が可能
ざっくりこんなイメージ 店舗ごとの売上デー タ データレイク データマート 変換 売上分析
データパイプラインの作成の前に・・ AWS Glue Studio というのがなんか 新機能っぽいぞ 実際にやってみる
‘‘AWS Glue Studio は、AWS Glue で抽出、変換、およびロード (ETL) ジョブの作成、実行、 監視を容易にする新しいグラフィカルインターフェイスです。’’ AWS
Glue Studio
キャンバス上でポチポチデータパイプラインを作成するなら 「Blank graph」を選択する Jobの作成
+でNodeを追加 ▪対応データソース S3、Kinesis、Kafka、JDBC、Redshift ▪変換処理 データマージやマッピングなど カスタムで定義可 ▪連携先 S3、AWS Glue Data
Catalog Jobの作成
フローを定義するとコード(Python)が生成される
実行
ここでちょっと思った お、GUIでデータパイプラインの定義 ができるのはよさげ。 けど、ETLならSaaS のデータも取得し たいんだけどなぁ。 自分で実装するのは辛し。
データソース DB DB DB DWH ETLおさらい(従来のETL) 変換 ロード 社内システム毎に保持 してるデータ
データソース DB DB DB DWH ETLおさらい 変換 ロード ETL:Extract Transform
Load の略 データを抽出して → 変換して → ターゲットDBにロードする という構成のこと
データソース 最近よくみるETLツール・サービスはこんな感じ 変換 ロード
ざっくりこんなイメージ(SaaSデータ版) SaaS データマート 変換 SaaSを横断したデー タ活用 コードを書かずGUIだけでこの構成を作りたい!
どうやってSaaSに接続するのか? 最近の話⇒ コネクタをサブスクライブ! 以上!
コネクタをサブスクライブしたら 例えば CData AWS Glue Connector for Salesforce を 登録したら、Node
type に表示 され選択できる
Salesforce から S3 へ S3を軸に、これまで以上に色んなサービ スやツールでのデータ活用が活性化さ れる DB
・Glue でカスタムコネクタというものが提供開始されてた ・SaaS をソースとしたデータパイプライン作成が容易 ・S3を軸としたデータ活用が更に活性化されそう まとめ Thank you!