Upgrade to Pro
— share decks privately, control downloads, hide ads and more …
Speaker Deck
Features
Speaker Deck
PRO
Sign in
Sign up for free
Search
Search
dbt-tokyo_meetup_2_ken_Airbyte_dbt_.pdf
Search
Sponsored
·
Ship Features Fearlessly
Turn features on and off without deploys. Used by thousands of Ruby developers.
→
ken
December 16, 2021
Technology
630
0
Share
Embed
Copy iframe code
Copy JS code
Copy link
Start on current slide
dbt-tokyo_meetup_2_ken_Airbyte_dbt_.pdf
ken
December 16, 2021
More Decks by ken
See All by ken
知見・人・API・DB・予算 ─ ナイナイ尽くしだった人事データ整備 with dbt、5年間の学び
ken6377
1
65
Other Decks in Technology
See All in Technology
BPaaSで進むAIオペレーションの現在地 AI実装が効く領域とスケーラビリティの選定と実装
kentarofujii
0
210
AWS Security Hub CSPMの成功・失敗体験
cmusudakeisuke
0
580
元・セキュリティ学習経験0大学生による業務紹介 / An Introduction to the Job by a Former College Student with Zero Security Training Experience
nttcom
0
670
本当の”仕事”を手放せる未来が見えた
mu7889yoon
0
160
はてなのサービス基盤を支える Kubernetes《足腰》
masayoshimaezawa
0
130
アラート調査向けAIエージェントの本番導入とその後/AI Agents for Alert Investigation: Production Deployment and After
taddy_919
1
220
AIをフル活用してオンコール機能のプロトタイプを2日で作った話 / Building an AI-Powered On-Call Prototype in Just Two Days
nari_ex
0
140
2026 AI Memory Architecture
nagatsu
0
490
Hatena Engineer Seminar 37 jj1uzh
jj1uzh
0
120
2026年6月23日 Syncable Tech + Start Python Club にて
hamukazu
0
150
Multi-Agent並列開発を 安全に回すための技術 / Technology for Safely Multi-Agent Parallel Development
tooppoo
0
210
週末にループ・エンジニアリングの理解を深めるためのスライド
nagatsu
0
510
Featured
See All Featured
DevOps and Value Stream Thinking: Enabling flow, efficiency and business value
helenjbeal
1
250
The AI Revolution Will Not Be Monopolized: How open-source beats economies of scale, even for LLMs
inesmontani
PRO
3
3.5k
WCS-LA-2024
lcolladotor
0
660
Darren the Foodie - Storyboard
khoart
PRO
3
3.4k
Bash Introduction
62gerente
615
220k
Odyssey Design
rkendrick25
PRO
2
710
Making the Leap to Tech Lead
cromwellryan
135
9.9k
Navigating the moral maze — ethical principles for Al-driven product design
skipperchong
2
400
The World Runs on Bad Software
bkeepers
PRO
72
12k
Noah Learner - AI + Me: how we built a GSC Bulk Export data pipeline
techseoconnect
PRO
0
200
Agile that works and the tools we love
rasmusluckow
331
22k
Evolving SEO for Evolving Search Engines
ryanjones
0
220
Transcript
dbt と Airbyte の連携 dbt tokyo Meetup #2 2021/12/16 @kwknkk
自己紹介 - 人事 (≠ データエンジニア、データアナリスト ) - 某マザーズ上場 S/W 企業(従業員数
200 名未満) - 海外子会社管理、人事制度、人員管理、採用、労務、開示 etc. - 2022/ 1~ People Engineer @ MoneyForward - 2021/ 5 ~ 10 データ基盤構築 (Zero to One) - ブルシットジョブ撲滅 & データサイロ化解消 - 事業、財務、人事の 3 領域 - スペック - スキル : SQL, Python, Git, Docker (ALL 経験年数 1 年未満 ) - 技術スタック : BigQuery, dbt, Airbyte 私は弱いがツールは強い。だから作れる(良い時代) Kenichi Kuwabara @kwknkk
Why Airbyte ? - parse 地獄からの逃避 - UI ポチポチ系を求めていた -
予算がなくて trocco 入れられなかった
Why dbt ? - 元 Dataform ユーザー - Airbyte ありきで、より楽な方法を模索していた
- Airbyte と抱き合わせで実行できて、管理対象物が減る - Airbyte(GCE インスタンススケジュール ) と Dataform を別々でスケジュール実行させていた - なんとなく盛り上がってる気がした
本番環境 ( サンプル :SFDC)
ソース 必要なフィールドだけ集めたレポートを作り、 Google アドオンでスプシに同期している。 - Airbyte の SFDC コネクタをそのまま使うと、オ ブジェクト内の全フィールドを拾ってしまう(そ
んなに要らない) - 見える場所にデータソースがあれば、誰か基 盤に興味を持ってくれるかもしれない ( という淡 い期待 )
スケジュール ワークフローエンジン不使用。 - Airbyte は 30 分おきで設定 (5 分でも別に良 い
) - GCE インスタンススケジュール (Airbyte をホ ストしている ) でジョブ制御 - 起動 : 40 8,13,17 * * 1-5 - 停止 : 0 9,14,18 * * 1-5 - インスタンス起動時に 1 回だけジョブが実行さ れる - 詳細はブログにて
カスタム dbt の使用 Git repository URL ~: https://{username}:{token}@github.com/{user}/{repo} -
Airbyte ジョブ → git clone → dbt run –full-refresh ( 下のケース ) の順に実行される - dbt の profiles.yml は Airbyte が自動生成するので気にしなくて良い - 任意の profile を指定したい場合は entrypoint に -profiles-dir=<path-to-my-profiles-yml> を 付け足せば良いらしい
最近知ったこと: dbt v1.0.0 への対応 Docker image URL~: xemuliam/dbt:1.0.0-bigquery - 今日現在
(2021/12/16) 、まだ公式イメージがリリースされていない為
最近知ったこと: Entrypoint について Entrypoint arguments~ : build - dbt {run,
test, snapshot,seed} を依存関係を考慮した上で全て実行してくれる
最近知ったこと: GitHub Actions 用 profiles.yml GitHub Actions 用にここに profiles.yml を置いても、
Airbyte や dbt Cloud 、その他環境でも悪さし ないことを確認出来たので、一安 心。 https://github.com/ken6377/dbt_m ulti_env
Thank You !!