sampel tidak mewakili populasi secara keseluruhan. Bias seperti ini dapat dihindari menggunakan teknik random sampling ketika mengumpulkan sebuah data.
karena adanya kecenderungan yang berbeda dari setiap individu ketika melakukan observasi. Bias jenis ini dapat dihindari dengan melakukan observasi berulang dan mengambil nilai rata-rata.
adanya kecenderungan dalam menginterpretasikan situasi ambigu hanya ke dalam dua keadaan. Hal ini dapat dihindari dengan cara melibatkan orang lain untuk mengonfirmasi hasil interpretasi yang kita buat.
adanya kecenderungan kita dalam mencari atau menafsirkan informasi untuk mengonfirmasi keyakinan yang sudah ada sebelumnya. Hal ini dapat dihindari dengan cara melibatkan orang lain untuk mengonfirmasi hasil interpretasi yang kita buat.
Orisinalitas Data Ownership (kepemilikan) dan sumber data. Komprehensif Memiliki semua informasi yang dibutuhkan. Aktualitas Data Data terbaru dan terkini. Data berkualitas, yang seperti apa?
sekumpulan data dengan visual dan narasi yang disesuaikan untuk setiap audiens tertentu. Question Data Wrangling EDA Data Visualization Draw Storytelling 5
Wrangling Data wrangling adalah proses mengubah dan memetakan data mentah menjadi format yang lebih sesuai untuk analisis dan pelaporan. Data Wrangling
Wrangling: Gathering Data Gathering Data Assessing Data Cleaning Data Proses pengumpulan data dari berbagai sumber untuk menjawab semua masalah yang ingin diselesaikan. Data yang dibutuhkan mungkin terdapat dalam berbagai sumber dan memiliki format yang berbeda-beda.
Wrangling: Assessing Data Gathering Data Assessing Data Cleaning Data Proses ini dilakukan untuk menilai kualitas dan struktur dari sebuah data. Selain itu, proses ini juga bertujuan untuk mengidentifikasi berbagai masalah yang terdapat dalam data.
Wrangling: Cleaning Data Gathering Data Assessing Data Cleaning Data Define Membuat rancangan tahapan serta metode pembersihan data berdasarkan masalah yang ditemukan dalam proses assessing data. Code Mengonversi hal tersebut menjadi sebuah kode program yang dapat dijalankan. Test Memeriksa kembali data yang telah dibersihkan tersebut. 03 01 02
Wrangling: Cleaning Data Gathering Data Assessing Data Cleaning Data Cleaning Data Missing Value/Duplikat Outlier Dropping Imputation Dropping Imputation
Data Analysis Exploratory Analysis Proses analisis data yang bertujuan untuk mengeksplorasi dan mengenal sebuah data. Explanatory Analysis Proses analisis data yang bertujuan untuk membagikan beberapa insight yang menarik dari sebuah data.
cara mendefinisikan pertanyaan untuk EDA? Problem solving Membuat pertanyaan yang efektif (effective question) Mengeksplorasi parameter statistik (stats parameter) dari data Mengelompokkan data (data grouping)
std min 25% 50% 75% max 3 numbers mean or average Standard Deviation minimum value 25th percentiles 50th percentiles 75th percentiles Maximum value s=pd.Series([2,3,4]) s.describe() 3 Question Data Wrangling EDA Data Visualization Draw Storytelling Problem Solving Effective Question Data Grouping Stats Parameter