implementation, and maintenance of systems and processes that take in raw data and produce high-quality, consistent information that supports downstream use cases, such as analysis and machine learning. (※1) • ものすごくざっくりまとめると: ◦ データパイプライン=⽣データをインプット、high-qualityでconsistentなデータをアウト プットとするシステム ◦ データパイプラインを開発し、維持していくのがデータエンジニアリング ◦ そのデータパイプラインは下流での利⽤を前提とし、分析や機械学習に利⽤される ※1: Reis, Joe; Housley, Matt. Fundamentals of Data Engineering (English Edition) (p.23). O'Reilly Media. Kindle 版.
sets to end users, modeling data in a way that empowers end users to answer their own questions. While a data analyst spends their time analyzing data, an analytics engineer spends their time transforming, testing, deploying, and documenting data. Analytics engineers apply software engineering best practices like version control and continuous integration to the analytics code base(※2) • 分解すると... ◦ ⽬的 ▪ エンドユーザーの意思決定⽀援 ◦ やること ▪ データの変換(transform) ▪ 品質テスト(testing) ▪ デプロイ ▪ ドキュメンテーションの作成 ※2: Carrol Claire, What is analytics engineering, https://www.getdbt.com/what-is-analytics-engineering