Upgrade to Pro — share decks privately, control downloads, hide ads and more …

DevCoach 167: Data Science | Aku Bisa, Coders! ...

Nad
September 08, 2024
80

DevCoach 167: Data Science | Aku Bisa, Coders! Mengolah Data Amburadul Jadi Lebih Insightful

Nad

September 08, 2024
Tweet

More Decks by Nad

Transcript

  1. Aku Bisa, Coders! Mengolah Data Amburadul Jadi Lebih Insightful Data

    Science Angel Metanosa Afinda Curriculum Developer Mochamad Rafy Ardhanie Curriculum Developer
  2. Pokok Pembahasan • Review Siklus Analisis Data • Pertimbangan dalam

    Pengolahan Data • Data Wrangling • Exploratory dan Explanatory Data Analysis • Ngoding tipis-tipis~ Data Science
  3. Bias dalam Data By definition, bias merupakan sebuah prasangka dan

    kecenderungan yang mendukung atau menentang suatu hal, individu, atau kelompok lain dengan cara yang kurang adil.
  4. Jenis-Jenis Bias dalam Data Sampling bias Sampling bias terjadi ketika

    sampel tidak mewakili populasi secara keseluruhan. Bias seperti ini dapat dihindari menggunakan teknik random sampling ketika mengumpulkan sebuah data.
  5. Jenis-Jenis Bias dalam Data Observer bias Bias tipe ini muncul

    karena adanya kecenderungan yang berbeda dari setiap individu ketika melakukan observasi. Bias jenis ini dapat dihindari dengan melakukan observasi berulang dan mengambil nilai rata-rata.
  6. Jenis-Jenis Bias dalam Data Interpretation bias Bias yang terjadi karena

    adanya kecenderungan dalam menginterpretasikan situasi ambigu hanya ke dalam dua keadaan. Hal ini dapat dihindari dengan cara melibatkan orang lain untuk mengonfirmasi hasil interpretasi yang kita buat.
  7. Jenis-Jenis Bias dalam Data Confirmation bias Bias ini muncul karena

    adanya kecenderungan kita dalam mencari atau menafsirkan informasi untuk mengonfirmasi keyakinan yang sudah ada sebelumnya. Hal ini dapat dihindari dengan cara melibatkan orang lain untuk mengonfirmasi hasil interpretasi yang kita buat.
  8. Reliabilitas Data Memuat informasi yang akurat, lengkap, dan tidak bias.

    Orisinalitas Data Ownership (kepemilikan) dan sumber data. Komprehensif Memiliki semua informasi yang dibutuhkan. Aktualitas Data Data terbaru dan terkini. Data berkualitas, yang seperti apa?
  9. Privasi dan Etika dalam Pengolahan Data 1. Ownership 2. Transparency

    3. Consent 4. Currency 5. Privacy & Openness
  10. Apa itu Data Storytelling? Data storytelling adalah mengomunikasikan makna dari

    sekumpulan data dengan visual dan narasi yang disesuaikan untuk setiap audiens tertentu. Question Data Wrangling EDA Data Visualization Draw Storytelling 5
  11. Question Data Wrangling EDA Data Visualization Draw Storytelling 2 Data

    Wrangling Data wrangling adalah proses mengubah dan memetakan data mentah menjadi format yang lebih sesuai untuk analisis dan pelaporan. Data Wrangling
  12. Question Data Wrangling EDA Data Visualization Draw Storytelling 2 Data

    Wrangling: Gathering Data Gathering Data Assessing Data Cleaning Data Proses pengumpulan data dari berbagai sumber untuk menjawab semua masalah yang ingin diselesaikan. Data yang dibutuhkan mungkin terdapat dalam berbagai sumber dan memiliki format yang berbeda-beda.
  13. Question Data Wrangling EDA Data Visualization Draw Storytelling 2 Data

    Wrangling: Gathering Data Gathering Data Assessing Data Cleaning Data
  14. Question Data Wrangling EDA Data Visualization Draw Storytelling 2 Data

    Wrangling: Gathering Data Gathering Data Assessing Data Cleaning Data
  15. Question Data Wrangling EDA Data Visualization Draw Storytelling 2 Data

    Wrangling: Assessing Data Gathering Data Assessing Data Cleaning Data Proses ini dilakukan untuk menilai kualitas dan struktur dari sebuah data. Selain itu, proses ini juga bertujuan untuk mengidentifikasi berbagai masalah yang terdapat dalam data.
  16. Question Data Wrangling EDA Data Visualization Draw Storytelling 2 Data

    Wrangling: Assessing Data Gathering Data Assessing Data Cleaning Data
  17. Question Data Wrangling EDA Data Visualization Draw Storytelling 2 Data

    Wrangling: Cleaning Data Gathering Data Assessing Data Cleaning Data Define Membuat rancangan tahapan serta metode pembersihan data berdasarkan masalah yang ditemukan dalam proses assessing data. Code Mengonversi hal tersebut menjadi sebuah kode program yang dapat dijalankan. Test Memeriksa kembali data yang telah dibersihkan tersebut. 03 01 02
  18. Question Data Wrangling EDA Data Visualization Draw Storytelling 2 Data

    Wrangling: Cleaning Data Gathering Data Assessing Data Cleaning Data Cleaning Data Missing Value/Duplikat Outlier Dropping Imputation Dropping Imputation
  19. Question Data Wrangling EDA Data Visualization Draw Storytelling 3 Exploratory

    Data Analysis Exploratory Analysis Proses analisis data yang bertujuan untuk mengeksplorasi dan mengenal sebuah data. Explanatory Analysis Proses analisis data yang bertujuan untuk membagikan beberapa insight yang menarik dari sebuah data.
  20. Question Data Wrangling EDA Data Visualization Draw Storytelling 3 Bagaimana

    cara mendefinisikan pertanyaan untuk EDA? Problem solving Membuat pertanyaan yang efektif (effective question) Mengeksplorasi parameter statistik (stats parameter) dari data Mengelompokkan data (data grouping)
  21. 3 Question Data Wrangling EDA Data Visualization Draw Storytelling Problem

    Solving Effective Question Data Grouping EDA Problem Solving Stats Parameter
  22. EDA: Effective Question 3 Question Data Wrangling EDA Data Visualization

    Draw Storytelling Problem Solving Effective Question Data Grouping Stats Parameter
  23. EDA: Stats Parameter - Mean (Rata-Rata) 3 Question Data Wrangling

    EDA Data Visualization Draw Storytelling Problem Solving Effective Question Data Grouping Stats Parameter
  24. EDA: Stats Parameter - Median (Nilai Tengah) 3 Question Data

    Wrangling EDA Data Visualization Draw Storytelling Problem Solving Effective Question Data Grouping Stats Parameter
  25. EDA: Stats Parameter - Modus (Nilai Sering Muncul) 3 Question

    Data Wrangling EDA Data Visualization Draw Storytelling Problem Solving Effective Question Data Grouping Stats Parameter
  26. 3.0 3.0 1.0 2.0 2.5 3.0 3.5 4.0 count mean

    std min 25% 50% 75% max 3 numbers mean or average Standard Deviation minimum value 25th percentiles 50th percentiles 75th percentiles Maximum value s=pd.Series([2,3,4]) s.describe() 3 Question Data Wrangling EDA Data Visualization Draw Storytelling Problem Solving Effective Question Data Grouping Stats Parameter
  27. 3 Question Data Wrangling EDA Data Visualization Draw Storytelling Problem

    Solving Effective Question Data Grouping Stats Parameter
  28. 3 Question Data Wrangling EDA Data Visualization Draw Storytelling Problem

    Solving Effective Question Data Grouping Stats Parameter
  29. Feedback! Hadiah: • 1 Token Langganan Academy (30 Hari) *untuk

    pengisi feedback terpilih! dicoding.id/devcoachfeedback