Sebelumnya kita sudah mempelajari konsep dasar dari machine learning dan di dalamnya terdapat dua metode yang digunakan, seperti supervised learning dan unsupervised learning.
Kini, saatnya membahas lebih lanjut definisi, tujuan, contoh kasus, dan algoritma dari masing-masing metode. Yuk, simak penjelasannya di artikel ini.
Supervised Learning
Supervised learning ialah salah satu jenis metode machine learning yang menggunakan data berlabel untuk melatih sebuah model. Algoritma dalam metode ini mempelajari hubungan antara input (fitur) dan output (label) untuk menghasilkan prediksi atau klasifikasi.
Setiap data dalam supervised learning memiliki label, seperti gambar burung yang diberi tag “burung” yang dapat membantu dikelompokkannya gambar sesuai dengan kategorinya.
Tujuannya adalah untuk dapat merancang model yang mampu membuat prediksi berdasarkan pola dalam data yang ada. Melalui proses pembelajaran dari berbagai pengamatan, sistem secara bertahap meningkatkan akurasi prediksinya.
Contoh Kasus
Berikut ini contoh kasus penerapan dalam dunia nyata pada supervised learning:
- Prediksi harga rumah (regresi). Dalam hal ini seperti menggunakan data pada luas tanah, lokasi, dan jumlah kamar untuk dapat memprediksi harga rumah tersebut.
- Mendeteksi email spam (klasifikasi). Dapat mengelompokkan email berdasarkan pada pola kata tertentu, apakah termasuk ke dalam spam atau bukan.
Algoritma
Dirancang untuk dapat menyelesaikan masalah prediksi dan klasifikasi. Berikut penjelasan lengkapnya.
Linear Regression
Dapat digunakan untuk memprediksi nilai kontinu, seperti memperkirakan harga rumah berdasarkan ukuran, lokasi, dan jumlah pada kamar.
Algoritma pada linear regression dapat digunakan untuk menemukan hubungan linear antara variabel input (independen) dan output (dependen). Contoh aplikasinya, estimasi biaya, prediksi penjualan, dan analisis tren.
Logistic Regression
Dapat menggunakan fungsi untuk memetakan nilai prediksi ke rentang probabilitas antara 0 dan 1, cocok untuk klasifikasi biner, seperti menemukan apakah email masuk ke dalam spam atau tidak. Contoh aplikasi, deteksi penyakit dan klasifikasi pada gambar.
Decision Tree
Pada algoritma ini dapat membentuk struktur seperti pohon, setiap cabang dapat menjelaskan aturan dan setiap daun dapat menunjukkan hasil. Contoh aplikasi, diagnosis medis dan analisis risiko.
Support Vector Machine (SVM)
Pada support vector machine dinilai efektif untuk data berdimensi tinggi dan dapat digunakan untuk data berdimensi tinggi, baik untuk klasifikasi maupun regresi. Contoh aplikasi, pengenalan wajah dan klasifikasi DNA.
Random Forest
Merupakan algoritma ensemble yang menggabungkan banyak decision tree untuk meningkatkan akurasi prediksi. Selain itu, dapat pula mengurangi overfitting dan memberikan hasil yang lebih stabil. Contoh aplikasi dapat berupa prediksi harga saham dan analisis data pelanggan.
Kelebihan dan Kekurangan pada Supervised Learning
Ada sejumlah kelebihan dan kekurangan yang sering diterapkan dalam berbagai aplikasi sehari-hari.
Kelebihan
- Dapat memprediksi yang akurat berkat keberadaan label atau kelas yang telah ditetapkan sebelumnya.
- Memiliki sebuah tujuan prediksi secara jelas dan terdefinisi dengan baik.
Kekurangan
- Membutuhkan sebuah data dengan berlabel pada setiap contoh yang pada proses pelabelannya bisa rumit atau memerlukan biaya yang cukup mahal.
- Tidak mampu untuk memproses sebuah data baru yang tidak memiliki label atau kelas.
Baca Juga: 5 Metode Machine Learning Wajib Diketahui untuk Pemula
Unsupervised Learning
Unsupervised learning adalah jenis metode lain dalam machine learning yang digunakan untuk menemukan pola atau struktur tersembunyi dalam data yang tidak memiliki label.
Misalnya aplikasi pendekatan ini adalah dalam pengelompokkan gambar buah berdasarkan visual, seperti gambar dengan warna ungu atau kuning dan berbentuk bulat, masuk ke dalam kelompok 2, hijau dan panjang di kelompok 2, serta putih dan lapisan merah di kelompok 3. Unsupervised learning dapat memberikan kebebasan dalam mengeksplorasi data dengan cara bebas tanpa adanya panduan atau label sebelumnya.
Tujuan dari unsupervised learning bertujuan untuk mengklasifikasikan data ke dalam kategori berdasarkan kesamaan (clustering) dan mengurangi jumlah variabel dalam dataset tanpa mengurangi informasi penting (reduksi dimensi) yang mempermudah pemrosesan data.
Contoh Kasus
Berikut contoh penerapan pada metode unsupervised learning.
- Segmentasi pelanggan. Mengelompokan pelanggan berdasarkan pola perilaku mereka, seperti kebiasaan berbelanja untuk menargetkan iklan atau promosi yang lebih efektif.
- Menganalisis pola pembelian konsumen. Dapat mengidentifikasi pola atau hubungan dalam perilaku pembelian untuk rekomendasi produk yang lebih baik.
Algoritma
K-Means
Algoritma yang mengelompokkan data ke dalam sejumlah cluster berdasarkan dengan tingkat kedekatannya. Metode ini meminimalkan variasi antar data dalam satu cluster dan memaksimalkan beragam antar cluster.
Hierarchical Clustering
Pada metode ini dikelompokan membentuk hirarki data, seperti struktur pohon dengan proses bertahap. Algoritma jenis ini dapat digunakan untuk sebuah data set kecil dan jumlah cluster yang belum diketahui.
Principal Component Analysis (PCA)
Sebuah teknik reduksi dimensi yang dapat mengidentifikasi komponen utama dalam data untuk menyederhanakan dataset tanpa harus kehilangan informasi penting.
Autoencoder
Jaringan netral yang digunakan untuk mengurangi dimensi data, cocok masuk ke dalam tugas-tugas, seperti pada kompresi data dan deteksi anomali.
Kelebihan dan Kekurangan pada Unsupervised Learning
Adapun keuntungan dan kerugian menggunakan unsupervised learning.
Kelebihan
- Mampu mengidentifikasi pola atau struktur tersembunyi dalam data tanpa adanya label yang sudah ada.
- Serta dapat berguna untuk mengeksplorasi dan menemukan wawasan baru.
Kekurangan
- Tidak mempunyai tujuan dengan prediksi yang jelas, sehingga hasilnya sulit untuk diinterpretasikan.
- Kurang efektifnya dalam menangani data yang sangat kompleks atau sedang kacau.
Perbedaan Supervised Learning dengan Unsupervised Learning
Berikut perbedaan pada supervised learning dan unsupervised learning
Metode | Tujuan | Contoh Kasus | Algoritma |
Supervised Learning | Memprediksi atau mengelompokkan data berdasarkan label yang telah ada. | Prediksi harga rumah dan deteksi email spam. | Linear Regression, Logistic Regression, Decision Tree, SVM, dan Random Forest |
Unsupervised Learning | Dapat mengklasifikasikan data atau mengurangi dimensi tanpa adanya label. | Segmentasi pada pelanggan dan analisis pola pembelian. | K-Means, Hierarchical, Clustering, PCA, dan Autoencoder. |