50 Soal Praktikum Klasifikasi Lanjutan Beserta Jawaban

Kumpulan Soal Pilihan Ganda Materi Praktikum Klasifikasi Lanjutan

Apa tujuan utama dari praktikum klasifikasi lanjutan?
a) Memprediksi masa depan
b) Menemukan pola tersembunyi dalam data
c) Menemukan outlier dalam data
d) Membuat laporan visual data

Jawaban: b) Menemukan pola tersembunyi dalam data

Teknik klasifikasi apa yang cenderung digunakan ketika data memiliki banyak fitur dan jumlah sampel yang relatif kecil?
a) Regresi Linear
b) K-Means Clustering
c) Decision Tree
d) Naive Bayes

Jawaban: c) Decision Tree

Apa yang dimaksud dengan "overfitting" dalam konteks klasifikasi?
a) Model terlalu sederhana untuk data
b) Model terlalu kompleks untuk data
c) Model menghasilkan prediksi yang tepat
d) Model tidak bisa mengatasi data yang hilang

Jawaban: b) Model terlalu kompleks untuk data

Metrik evaluasi mana yang sesuai ketika klasifikasi memiliki kelas minoritas yang penting dan tidak ingin terjadi kesalahan pada kelas tersebut?
a) Akurasi
b) Presisi
c) Recall
d) F1-Score

Jawaban: b) Presisi

Algoritma apa yang umumnya digunakan untuk klasifikasi teks, seperti analisis sentimen?
a) K-Nearest Neighbors
b) Support Vector Machine
c) Naive Bayes
d) K-Means Clustering

Jawaban: c) Naive Bayes

Pada praktikum klasifikasi, apa yang dimaksud dengan "feature extraction"?
a) Mengklasifikasikan fitur-fitur baru
b) Mengurangi dimensi data
c) Mengubah data mentah menjadi fitur yang lebih bermakna
d) Menggabungkan beberapa dataset menjadi satu

Jawaban: c) Mengubah data mentah menjadi fitur yang lebih bermakna

Manakah dari berikut yang bukan termasuk dalam algoritma klasifikasi berbasis ensemble?
a) Random Forest
b) Decision Tree
c) AdaBoost
d) Gradient Boosting

Jawaban: b) Decision Tree

Mengapa penting untuk membagi dataset menjadi data pelatihan dan data pengujian dalam klasifikasi?
a) Agar kita bisa memiliki lebih banyak data
b) Agar kita bisa menghindari overfitting
c) Agar kita bisa menggunakan lebih banyak fitur
d) Agar kita bisa mempercepat pelatihan model

Jawaban: b) Agar kita bisa menghindari overfitting

Pada algoritma Support Vector Machine (SVM), apa yang disebut dengan "kernel"?
a) Sebuah lapisan pelindung pada model
b) Fungsi matematis untuk memetakan data ke dimensi yang lebih tinggi
c) Metode evaluasi model
d) Ukuran tingkat akurasi model

Jawaban: b) Fungsi matematis untuk memetakan data ke dimensi yang lebih tinggi

Manakah di bawah ini adalah contoh metode klasifikasi semi-terawasi?
a) K-Means Clustering
b) Naive Bayes
c) Support Vector Machine
d) Self-Training

Jawaban: d) Self-Training

Algoritma apa yang menghasilkan garis linear yang memisahkan dua kelas pada ruang fitur?
a) Decision Tree
b) K-Nearest Neighbors
c) Naive Bayes
d) Support Vector Machine

Jawaban: d) Support Vector Machine

Apa yang dimaksud dengan "cross-validation" dalam konteks klasifikasi?
a) Menggabungkan beberapa dataset menjadi satu
b) Mengevaluasi model pada data yang sama dengan pelatihannya
c) Memisahkan dataset menjadi dua bagian
d) Memisahkan dataset menjadi beberapa subset untuk evaluasi

Jawaban: d) Memisahkan dataset menjadi beberapa subset untuk evaluasi

Manakah dari berikut ini bukan metode reduksi dimensi dalam klasifikasi?
a) Principal Component Analysis (PCA)
b) Linear Regression
c) t-Distributed Stochastic Neighbor Embedding (t-SNE)
d) Lasso Regression

Jawaban: b) Linear Regression

Pada klasifikasi multikelas, apa yang dimaksud dengan "one-vs-all"?
a) Setiap kelas memiliki model terpisah
b) Setiap kelas hanya memiliki satu sampel
c) Setiap kelas memiliki fitur terpisah
d) Setiap kelas memiliki subset data terpisah

Jawaban: a) Setiap kelas memiliki model terpisah

Manakah dari berikut ini adalah metode regresi yang dapat digunakan untuk masalah klasifikasi?
a) Ridge Regression
b) Lasso Regression
c) Support Vector Machine
d) Polynomial Regression

Jawaban: c) Support Vector Machine

Bagaimana cara mengatasi masalah kelas yang tidak seimbang dalam dataset klasifikasi?
a) Menghapus data kelas minoritas
b) Menambahkan data ke kelas mayoritas
c) Menimbang ulang bobot kelas
d) Menggabungkan kelas minoritas

Jawaban: c) Menimbang ulang bobot kelas

Algoritma klasifikasi apa yang memiliki nama yang terinspirasi dari cara manusia mengklasifikasikan objek dalam kehidupan sehari-hari?
a) K-Means Clustering
b) Naive Bayes
c) Decision Tree
d) Support Vector Machine

Jawaban: c) Decision Tree

Dalam konteks klasifikasi, apa itu "confusion matrix"?
a) Matriks yang membingungkan
b) Matriks untuk mengukur tingkat akurasi model
c) Matriks yang membandingkan dua dataset
d) Matriks yang menunjukkan performa klasifikasi pada berbagai kelas

Jawaban: d) Matriks yang menunjukkan performa klasifikasi pada berbagai kelas

Apa yang dimaksud dengan "hyperparameter" dalam konteks klasifikasi?
a) Parameter yang dihasilkan oleh model
b) Parameter yang mempengaruhi perilaku model tetapi tidak dipelajari oleh model itu sendiri
c) Parameter yang disesuaikan secara otomatis oleh model
d) Parameter yang hanya relevan dalam klasifikasi multi-label

Jawaban: b) Parameter yang mempengaruhi perilaku model tetapi tidak dipelajari oleh model itu sendiri

Pada klasifikasi, apa itu "recall"?
a) Kemampuan model untuk memprediksi dengan benar
b) Kemampuan model untuk memisahkan antara dua kelas
c) Kemampuan model untuk mengenali kelas minoritas
d) Kemampuan model untuk mengurangi dimensi fitur

Jawaban: c) Kemampuan model untuk mengenali kelas minoritas

Manakah dari berikut ini adalah algoritma yang bisa digunakan untuk klasifikasi berbasis teks?
a) K-Means Clustering
b) Random Forest
c) Naive Bayes
d) K-Nearest Neighbors

Jawaban: c) Naive Bayes

Apa tujuan dari "grid search" dalam praktikum klasifikasi?
a) Mencari data baru untuk melengkapi dataset
b) Mencari fitur-fitur terbaik dalam data
c) Mencari nilai hyperparameter terbaik untuk model
d) Mencari data outlier dalam dataset

Jawaban: c) Mencari nilai hyperparameter terbaik untuk model

Pada klasifikasi, apa yang dimaksud dengan "precision"?
a) Kemampuan model untuk memprediksi dengan benar
b) Kemampuan model untuk memisahkan antara dua kelas
c) Proporsi positif sejati dari hasil positif yang diprediksi
d) Proporsi negatif sejati dari hasil negatif yang diprediksi

Jawaban: c) Proporsi positif sejati dari hasil positif yang diprediksi

Manakah dari berikut ini adalah algoritma klasifikasi yang menggabungkan beberapa model menjadi satu?
a) Decision Tree
b) Naive Bayes
c) Support Vector Machine
d) Random Forest

Jawaban: d) Random Forest

Dalam konteks klasifikasi, apa yang dimaksud dengan "bagging"?
a) Mengurangi dimensi data
b) Menggabungkan beberapa dataset menjadi satu
c) Menggabungkan beberapa model menjadi satu
d) Menggabungkan beberapa fitur menjadi satu

Jawaban: c) Menggabungkan beberapa model menjadi satu

Manakah dari berikut ini adalah metode klasifikasi berbasis jarak?
a) Decision Tree
b) K-Nearest Neighbors
c) Naive Bayes
d) Random Forest

Jawaban: b) K-Nearest Neighbors

Apa yang dimaksud dengan "ROC curve" dalam evaluasi klasifikasi?
a) Grafik yang menunjukkan performa model pada berbagai threshold
b) Grafik yang menunjukkan distribusi data
c) Grafik yang menunjukkan pola korelasi antara fitur-fitur
d) Grafik yang menunjukkan distribusi kelas pada dataset

Jawaban: a) Grafik yang menunjukkan performa model pada berbagai threshold

Algoritma klasifikasi mana yang berusaha membangun sejumlah kecil model yang lemah untuk menghasilkan model yang kuat?
a) Random Forest
b) Support Vector Machine
c) AdaBoost
d) K-Means Clustering

Jawaban: c) AdaBoost

Pada klasifikasi, apa yang dimaksud dengan "false positive"?
a) Prediksi yang salah pada kelas positif
b) Prediksi yang benar pada kelas positif
c) Prediksi yang salah pada kelas negatif
d) Prediksi yang benar pada kelas negatif

Jawaban: a) Prediksi yang salah pada kelas positif

Apa yang dimaksud dengan "feature selection" dalam konteks klasifikasi?
a) Mengklasifikasikan fitur-fitur baru
b) Memilih subset fitur yang paling relevan dari dataset
c) Mengurangi dimensi data
d) Mencari outlier dalam data

Jawaban: b) Memilih subset fitur yang paling relevan dari dataset

Algoritma apa yang mencoba untuk memisahkan kelas dalam bentuk garis linear di antara mereka dalam ruang fitur?
a) Decision Tree
b) Naive Bayes
c) Support Vector Machine
d) K-Means Clustering

Jawaban: c) Support Vector Machine

Apa yang dimaksud dengan "k-fold cross-validation"?
a) Membagi dataset menjadi dua bagian
b) Membagi dataset menjadi beberapa subset untuk evaluasi
c) Mengevaluasi model pada data yang sama dengan pelatihannya
d) Menggabungkan beberapa dataset menjadi satu

Jawaban: b) Membagi dataset menjadi beberapa subset untuk evaluasi

Manakah dari berikut ini adalah contoh metode ensemble?
a) Linear Regression
b) Decision Tree
c) Support Vector Machine
d) Random Forest

Jawaban: d) Random Forest

Algoritma apa yang cocok digunakan ketika ada asumsi bahwa atribut-atribut independen dalam klasifikasi?
a) Decision Tree
b) K-Means Clustering
c) Naive Bayes
d) Support Vector Machine

Jawaban: c) Naive Bayes

Bagaimana Anda dapat menghindari overfitting dalam model klasifikasi?
a) Mengurangi jumlah data pelatihan
b) Menambahkan lebih banyak fitur
c) Menggunakan model yang sangat kompleks
d) Menggunakan validasi silang dan mengurangi kompleksitas model

Jawaban: d) Menggunakan validasi silang dan mengurangi kompleksitas model

Apa yang dimaksud dengan "kappa statistic" dalam evaluasi klasifikasi?
a) Metrik yang mengukur sejauh mana model mendekati prediksi yang benar
b) Metrik yang mengukur sejauh mana model memprediksi dengan benar
c) Metrik yang mengukur tingkat kesepakatan antara prediksi dan data aktual
d) Metrik yang mengukur seberapa baik model memisahkan antara kelas

Jawaban: c) Metrik yang mengukur tingkat kesepakatan antara prediksi dan data aktual

Pada algoritma klasifikasi Decision Tree, apa yang digunakan untuk memilih atribut yang akan menjadi akar pohon?
a) Entropi
b) Gini Impurity
c) Euclidean Distance
d) Variance

Jawaban: b) Gini Impurity

Apa yang dimaksud dengan "false negative" dalam klasifikasi?
a) Prediksi yang salah pada kelas positif
b) Prediksi yang benar pada kelas positif
c) Prediksi yang salah pada kelas negatif
d) Prediksi yang benar pada kelas negatif

Jawaban: c) Prediksi yang salah pada kelas negatif

Dalam evaluasi klasifikasi, metrik apa yang mengukur akurasi model terhadap semua kelas?
a) Akurasi
b) Presisi
c) Recall
d) F1-Score

Jawaban: a) Akurasi

Algoritma klasifikasi mana yang bekerja dengan membagi dataset menjadi beberapa bagian lalu mengklasifikasikan data yang tidak ada dalam bagian pelatihan?
a) K-Means Clustering
b) Decision Tree
c) K-Nearest Neighbors
d) Support Vector Machine

Jawaban: c) K-Nearest Neighbors

Dalam klasifikasi, apa yang dimaksud dengan "false discovery rate"?
a) Proporsi positif sejati dari hasil positif yang diprediksi
b) Proporsi negatif sejati dari hasil negatif yang diprediksi
c) Proporsi prediksi positif yang salah dari hasil positif yang diprediksi
d) Proporsi prediksi negatif yang salah dari hasil negatif yang diprediksi

Jawaban: c) Proporsi prediksi positif yang salah dari hasil positif yang diprediksi

Manakah dari berikut ini adalah algoritma yang cocok untuk klasifikasi data yang memiliki banyak fitur namun jumlah sampel yang terbatas?
a) Support Vector Machine
b) K-Means Clustering
c) Decision Tree
d) K-Nearest Neighbors

Jawaban: a) Support Vector Machine

Pada klasifikasi, apa itu "receiver operating characteristic (ROC)"?
a) Metode untuk memilih fitur terbaik
b) Grafik yang menggambarkan performa model pada berbagai threshold
c) Metode untuk menghitung akurasi model
d) Grafik yang menggambarkan distribusi kelas pada dataset

Jawaban: b) Grafik yang menggambarkan performa model pada berbagai threshold

Metrik evaluasi mana yang memberikan keseimbangan antara presisi dan recall?
a) Akurasi
b) F1-Score
c) Gini Impurity
d) Variance

Jawaban: b) F1-Score

Algoritma apa yang mengelompokkan data menjadi kelompok-kelompok yang memiliki atribut-atribut serupa?
a) K-Nearest Neighbors
b) Decision Tree
c) K-Means Clustering
d) Naive Bayes

Jawaban: c) K-Means Clustering

Pada klasifikasi, apa itu "entropy"?
a) Ukuran jarak antara dua titik dalam ruang fitur
b) Ukuran ketidakmurnian atau keacakan dalam kelas
c) Ukuran akurasi model
d) Ukuran jumlah fitur dalam dataset

Jawaban: b) Ukuran ketidakmurnian atau keacakan dalam kelas

Apa yang dimaksud dengan "unsupervised learning" dalam konteks klasifikasi?
a) Model belajar dari contoh data yang diberikan
b) Model tidak memiliki contoh data pelatihan
c) Model hanya belajar dari hasil prediksi yang salah
d) Model hanya belajar dari hasil prediksi yang benar

Jawaban: b) Model tidak memiliki contoh data pelatihan

Dalam klasifikasi, apa yang dimaksud dengan "bias-variance trade-off"?
a) Kompromi antara kualitas fitur dan jumlah fitur
b) Kompromi antara akurasi model dan jumlah sampel
c) Kompromi antara kompleksitas model dan kemampuannya untuk memgeneralisasi
d) Kompromi antara bobot kelas yang tidak seimbang

Jawaban: c) Kompromi antara kompleksitas model dan kemampuannya untuk memgeneralisasi

Manakah dari berikut ini bukan metode klasifikasi?
a) Logistic Regression
b) K-Means Clustering
c) Random Forest
d) Decision Tree

Jawaban: b) K-Means Clustering

Pada klasifikasi, apa itu "ensemble learning"?
a) Penggunaan berbagai jenis algoritma klasifikasi pada dataset yang sama
b) Penggabungan beberapa dataset untuk pelatihan model
c) Menggabungkan beberapa fitur menjadi satu
d) Membagi dataset menjadi beberapa subset untuk evaluasi

Jawaban: a) Penggunaan berbagai jenis algoritma klasifikasi pada dataset yang sama