learning adalah regresi dan klasifikasi. • Model regresi memprediksi nilai angka dari banyak kemungkinan angka. • Model klasifikasi memprediksi kemungkinan bahwa sesuatu termasuk dalam kategori tertentu.
learning, yaitu model dilatih menggunakan data yang tidak memiliki label atau target output yang sudah ditentukan sebelumnya. Unsupervised Learning Data Algoritma Meaningful patterns
Clustering (dibagi berdasarkan kesamaan) Association (menemukan hubungan yang menarik) Dimensionality Reduction (kompres kumpulan data besar) Anomaly Detection (mendeteksi kejadian yang tidak biasa)
Splitting dan Modelling Evaluasi dan Monitoring Model 1 Proses pengumpulan data dari berbagai sumber untuk menjawab semua masalah yang ingin diselesaikan. Data yang dibutuhkan mungkin terdapat dalam berbagai sumber dan memiliki format yang berbeda-beda.
Splitting dan Modelling Evaluasi dan Monitoring Model 2 Proses ini dilakukan untuk menilai kualitas dan struktur dari sebuah data. Selain itu, proses ini juga bertujuan untuk mengidentifikasi berbagai masalah yang terdapat dalam data.
Splitting dan Modelling Evaluasi dan Monitoring Model 2 Data Cleaning Define Membuat rancangan tahapan serta metode pembersihan data berdasarkan masalah yang ditemukan dalam proses assessing data. Code Mengonversi hal tersebut menjadi sebuah kode program yang dapat dijalankan. Test Memeriksa kembali data yang telah dibersihkan tersebut. 03 01 02
Modelling Evaluasi dan Monitoring Model 2 Test Memeriksa kembali data yang telah dibersihkan tersebut. Data Transformation Normalisasi dan Standardisasi Data
Modelling Evaluasi dan Monitoring Model 2 Test Memeriksa kembali data yang telah dibersihkan tersebut. Data Transformation Normalisasi dan Standardisasi Data
Modelling Evaluasi dan Monitoring Model 2 Test Memeriksa kembali data yang telah dibersihkan tersebut. Data Transformation Encoding Variabel Kategorikal Encoding variabel kategorikal adalah proses mengubah data kategorikal (yaitu data yang terdiri dari label atau kategori) menjadi bentuk numerik agar dapat digunakan oleh algoritma machine learning.
Modelling Evaluasi dan Monitoring Model 3 Test Memeriksa kembali data yang telah dibersihkan tersebut. Exploratory Analysis Proses analisis data yang bertujuan untuk mengeksplorasi dan mengenal sebuah data. Explanatory Analysis Proses analisis data yang bertujuan untuk membagikan beberapa insight yang menarik dari sebuah data. Exploratory Data Analysis
Modelling Evaluasi dan Monitoring Model 3 Test Memeriksa kembali data yang telah dibersihkan tersebut. Bagaimana cara mendefinisikan pertanyaan untuk EDA? Problem solving Membuat pertanyaan yang efektif (effective question) Mengeksplorasi parameter statistik (stats parameter) dari data Mengelompokkan data (data grouping)
Modelling Evaluasi dan Monitoring Model 3 EDA: Effective Question Measurable Dapat dinilai atau diukur dengan data kuantitatif atau kualitatif. Specific Pertanyaannya harus jelas dan fokus pada satu area. Achievable Realistis dan bisa dicapai berdasarkan sumber daya yang tersedia. Time-bound Memiliki batas waktu yang jelas untuk pencapaian hasil. Relevant Sesuai dengan tujuan atau kebutuhan bisnis.
Modelling Evaluasi dan Monitoring Model 3 Relevant Sesuai dengan tujuan atau kebutuhan bisnis. Cara kita dalam menyajikan data dalam bentuk visual untuk mempermudah kita dan orang lain dalam memahami data. EDA: Visualisasi
Modelling Evaluasi dan Monitoring Model 4 Relevant Sesuai dengan tujuan atau kebutuhan bisnis. Data Splitting Data Splitting adalah proses membagi dataset menjadi beberapa subset yang terpisah untuk tujuan pelatihan, validasi, dan pengujian model machine learning.
Modelling Evaluasi dan Monitoring Model 4 Relevant Sesuai dengan tujuan atau kebutuhan bisnis. Modelling Data modeling adalah proses ketika memilih, melatih, dan mengevaluasi model machine learning untuk memprediksi atau mengklasifikasikan data berdasarkan fitur/variabel yang tersedia.
Modelling Evaluasi dan Monitoring Model 5 Relevant Sesuai dengan tujuan atau kebutuhan bisnis. Evaluation Model pada Klasifikasi Proporsi dari prediksi yang benar terhadap total prediksi yang dibuat. Proporsi prediksi positif yang benar dibandingkan dengan total prediksi positif. Proporsi data positif yang berhasil diprediksi dengan benar oleh model. Harmonik rata-rata dari precision dan recall, berguna ketika ada ketidakseimbangan antara kelas.
Modelling Evaluasi dan Monitoring Model 5 Relevant Sesuai dengan tujuan atau kebutuhan bisnis. Evaluation Model pada Regresi Rata-rata dari selisih absolut antara nilai prediksi dan nilai aktual. Rata-rata dari kuadrat selisih antara nilai prediksi dan nilai aktual.