Big Data

Read Time: 5 minute(s)

Perbedaan Supervised Learning vs Unsupervised Learning

Ucy Sugiarti
Publish: November 28, 2024

Home / Blog / Perbedaan Supervised Learning vs Unsupervised Learning

Bagikan artikel:

Sebelumnya kita sudah mempelajari konsep dasar dari machine learning dan di dalamnya terdapat dua metode yang digunakan, seperti supervised learning dan unsupervised learning.

Kini, saatnya membahas lebih lanjut definisi, tujuan, contoh kasus, dan algoritma dari masing-masing metode. Yuk, simak penjelasannya di artikel ini.

Supervised Learning

Supervised learning ialah salah satu jenis metode machine learning yang menggunakan data berlabel untuk melatih sebuah model. Algoritma dalam metode ini mempelajari hubungan antara input (fitur) dan output (label) untuk menghasilkan prediksi atau klasifikasi.

Setiap data dalam supervised learning memiliki label, seperti gambar burung yang diberi tag “burung” yang dapat membantu dikelompokkannya gambar sesuai dengan kategorinya.

Tujuannya adalah untuk dapat merancang model yang mampu membuat prediksi berdasarkan pola dalam data yang ada. Melalui proses pembelajaran dari berbagai pengamatan, sistem secara bertahap meningkatkan akurasi prediksinya.

Contoh Kasus

Berikut ini contoh kasus penerapan dalam dunia nyata pada supervised learning:

Prediksi harga rumah (regresi). Dalam hal ini seperti menggunakan data pada luas tanah, lokasi, dan jumlah kamar untuk dapat memprediksi harga rumah tersebut.
Mendeteksi email spam (klasifikasi). Dapat mengelompokkan email berdasarkan pada pola kata tertentu, apakah termasuk ke dalam spam atau bukan.

Algoritma

Dirancang untuk dapat menyelesaikan masalah prediksi dan klasifikasi. Berikut penjelasan lengkapnya.

Linear Regression

Dapat digunakan untuk memprediksi nilai kontinu, seperti memperkirakan harga rumah berdasarkan ukuran, lokasi, dan jumlah pada kamar.

Algoritma pada linear regression dapat digunakan untuk menemukan hubungan linear antara variabel input (independen) dan output (dependen). Contoh aplikasinya, estimasi biaya, prediksi penjualan, dan analisis tren.

Logistic Regression

Dapat menggunakan fungsi untuk memetakan nilai prediksi ke rentang probabilitas antara 0 dan 1, cocok untuk klasifikasi biner, seperti menemukan apakah email masuk ke dalam spam atau tidak. Contoh aplikasi, deteksi penyakit dan klasifikasi pada gambar.

Decision Tree

Pada algoritma ini dapat membentuk struktur seperti pohon, setiap cabang dapat menjelaskan aturan dan setiap daun dapat menunjukkan hasil. Contoh aplikasi, diagnosis medis dan analisis risiko.

Support Vector Machine (SVM)

Pada support vector machine dinilai efektif untuk data berdimensi tinggi dan dapat digunakan untuk data berdimensi tinggi, baik untuk klasifikasi maupun regresi. Contoh aplikasi, pengenalan wajah dan klasifikasi DNA.

Random Forest

Merupakan algoritma ensemble yang menggabungkan banyak decision tree untuk meningkatkan akurasi prediksi. Selain itu, dapat pula mengurangi overfitting dan memberikan hasil yang lebih stabil. Contoh aplikasi dapat berupa prediksi harga saham dan analisis data pelanggan.

Kelebihan dan Kekurangan pada Supervised Learning

Ada sejumlah kelebihan dan kekurangan yang sering diterapkan dalam berbagai aplikasi sehari-hari.

Kelebihan

Dapat memprediksi yang akurat berkat keberadaan label atau kelas yang telah ditetapkan sebelumnya.
Memiliki sebuah tujuan prediksi secara jelas dan terdefinisi dengan baik.

Kekurangan

Membutuhkan sebuah data dengan berlabel pada setiap contoh yang pada proses pelabelannya bisa rumit atau memerlukan biaya yang cukup mahal.
Tidak mampu untuk memproses sebuah data baru yang tidak memiliki label atau kelas.

Unsupervised Learning

Unsupervised learning adalah jenis metode lain dalam machine learning yang digunakan untuk menemukan pola atau struktur tersembunyi dalam data yang tidak memiliki label.

Misalnya aplikasi pendekatan ini adalah dalam pengelompokkan gambar buah berdasarkan visual, seperti gambar dengan warna ungu atau kuning dan berbentuk bulat, masuk ke dalam kelompok 2, hijau dan panjang di kelompok 2, serta putih dan lapisan merah di kelompok 3. Unsupervised learning dapat memberikan kebebasan dalam mengeksplorasi data dengan cara bebas tanpa adanya panduan atau label sebelumnya.

Tujuan dari unsupervised learning bertujuan untuk mengklasifikasikan data ke dalam kategori berdasarkan kesamaan (clustering) dan mengurangi jumlah variabel dalam dataset tanpa mengurangi informasi penting (reduksi dimensi) yang mempermudah pemrosesan data.

Contoh Kasus

Berikut contoh penerapan pada metode unsupervised learning.

Segmentasi pelanggan. Mengelompokan pelanggan berdasarkan pola perilaku mereka, seperti kebiasaan berbelanja untuk menargetkan iklan atau promosi yang lebih efektif.
Menganalisis pola pembelian konsumen. Dapat mengidentifikasi pola atau hubungan dalam perilaku pembelian untuk rekomendasi produk yang lebih baik.

Algoritma

K-Means

Algoritma yang mengelompokkan data ke dalam sejumlah cluster berdasarkan dengan tingkat kedekatannya. Metode ini meminimalkan variasi antar data dalam satu cluster dan memaksimalkan beragam antar cluster.

Hierarchical Clustering

Pada metode ini dikelompokan membentuk hirarki data, seperti struktur pohon dengan proses bertahap. Algoritma jenis ini dapat digunakan untuk sebuah data set kecil dan jumlah cluster yang belum diketahui.

Principal Component Analysis (PCA)

Sebuah teknik reduksi dimensi yang dapat mengidentifikasi komponen utama dalam data untuk menyederhanakan dataset tanpa harus kehilangan informasi penting.

Autoencoder

Jaringan netral yang digunakan untuk mengurangi dimensi data, cocok masuk ke dalam tugas-tugas, seperti pada kompresi data dan deteksi anomali.

Kelebihan dan Kekurangan pada Unsupervised Learning

Adapun keuntungan dan kerugian menggunakan unsupervised learning.

Kelebihan

Mampu mengidentifikasi pola atau struktur tersembunyi dalam data tanpa adanya label yang sudah ada.
Serta dapat berguna untuk mengeksplorasi dan menemukan wawasan baru.

Kekurangan

Tidak mempunyai tujuan dengan prediksi yang jelas, sehingga hasilnya sulit untuk diinterpretasikan.
Kurang efektifnya dalam menangani data yang sangat kompleks atau sedang kacau.

Perbedaan Supervised Learning dengan Unsupervised Learning

Berikut perbedaan pada supervised learning dan unsupervised learning

Metode	Tujuan	Contoh Kasus	Algoritma
Supervised Learning	Memprediksi atau mengelompokkan data berdasarkan label yang telah ada.	Prediksi harga rumah dan deteksi email spam.	Linear Regression, Logistic Regression, Decision Tree, SVM, dan Random Forest
Unsupervised Learning	Dapat mengklasifikasikan data atau mengurangi dimensi tanpa adanya label.	Segmentasi pada pelanggan dan analisis pola pembelian.	K-Means, Hierarchical, Clustering, PCA, dan Autoencoder.

Tabel perbedaan supervised learning vs unsupervised learning

Perbedaan Supervised Learning vs Unsupervised Learning

Supervised Learning

Contoh Kasus

Algoritma

Linear Regression

Logistic Regression

Decision Tree

Support Vector Machine (SVM)

Random Forest

Kelebihan dan Kekurangan pada Supervised Learning

Kelebihan

Kekurangan

Unsupervised Learning

Contoh Kasus

Algoritma

K-Means

Hierarchical Clustering

Principal Component Analysis (PCA)

Autoencoder

Kelebihan dan Kekurangan pada Unsupervised Learning

Kelebihan

Kekurangan

Perbedaan Supervised Learning dengan Unsupervised Learning

Artikel Terkait

Pengertian Timing Diagram: Fungsi, Komponen, dan Contohnya

Apa Itu Big Data? Definisi, Karakteristik, Fungsi, dan Contoh

Perbedaan Database, Data Warehouse, Data Mining, dan Data Center

Butuh Services dan Product Lawencon?