Langsung ke konten utama

Postingan

Menampilkan postingan dari Juni, 2024

DATA PREPARATION & VISUALIZATION

Data Preparation Data preparation atau persiapan data adalah langkah-langkah yang dilakukan untuk mempersiapkan data mentah sebelum digunakan dalam analisis dan pemodelan. Tujuannya adalah memastikan bahwa data yang akan digunakan adalah bersih, konsisten, dan dalam format yang sesuai untuk analisis atau pelatihan model pembelajaran mesin. Proses ini melibatkan berbagai tahapan, seperti pembersihan data, transformasi data, dan pengurangan dimensi. Contoh kode untuk Data Preparation dalam Python menggunakan library pandas: import pandas as pd # Membaca data dari file CSV data = pd.read_csv ( 'data.csv' ) # Pembersihan data: menghapus entri duplikat dan menangani nilai yang hilang data.drop_duplicates ( inplace= True ) data.dropna ( inplace= True ) # Transformasi data: mengubah format tanggal, mengonversi variabel kategorikal menjadi numerik, dll. data [ 'tanggal' ] = pd.to_datetime ( data [ 'tanggal' ]) data [ 'jenis_kelamin' ] = data [ 'jenis_kel...

PRE-PROCESSING

Pre-processing atau prapemrosesan adalah tahap awal dalam proses analisis data dan pembelajaran mesin (machine learning) yang bertujuan untuk mempersiapkan data mentah menjadi format yang sesuai untuk digunakan dalam model. Tahap ini sangat penting karena kualitas data yang digunakan akan sangat mempengaruhi kinerja dan akurasi model yang akan dibangun. Pre-processing mencakup berbagai teknik dan langkah-langkah untuk membersihkan, mengubah, dan menyusun data agar lebih mudah dianalisis. Beberapa langkah umum dalam pre-processing meliputi:   Pembersihan Data (Data Cleaning): Mengatasi Missing Values: Mengisi atau menghapus data yang hilang. Menghilangkan Duplikasi: Menghapus data yang duplikat atau redundan. Mengoreksi Kesalahan: Memperbaiki kesalahan dalam data, seperti kesalahan pengetikan atau inkonsistensi format. import pandas as pd # Membaca data dari file CSV data = pd.read_csv ( 'data.csv' ) # Menghapus baris yang memiliki nilai yang hilang (NaN) di kolom tertentu ...

SUPERVISED LEARNING (PREDIKSI) 30 ALGORITMA

1. Pengertian Supervised Learning: Supervised Learning adalah salah satu metode dalam pembelajaran mesin (machine learning) di mana model dilatih menggunakan data yang sudah diberi label. Data berlabel berarti setiap data input memiliki output yang diketahui dan telah ditentukan sebelumnya. Proses pelatihan ini melibatkan pemetaan input ke output yang benar, dengan tujuan agar model dapat melakukan prediksi yang akurat pada data baru yang belum pernah dilihat sebelumnya. Dalam supervised learning, model dibimbing (supervised) dengan contoh-contoh dari data berlabel, sehingga dapat belajar dari pola-pola yang ada untuk kemudian digunakan dalam memprediksi atau mengklasifikasikan data yang tidak dikenal. Terdapat dua jenis utama tugas dalam supervised learning, yaitu: Klasifikasi : Di mana output yang diprediksi adalah kategori atau kelas (contohnya, deteksi email spam, diagnosis penyakit). Regres i: Di mana output yang diprediksi adalah nilai kontinu (contohnya, prediksi harga rumah, ...