50 Soal Machine Learning Beserta Jawaban
Kumpulan Soal Pilihan Ganda Materi Machine Learning
1. Algoritma Machine Learning yang paling umum digunakan untuk klasifikasi adalah:
a. Linear Regression
b. Naive Bayes
c. K-Means
d. Decision Tree
Jawaban: d
2. Supervised learning adalah:
a. Menggunakan dataset yang tidak memiliki label
b. Memperoleh informasi dari pengalaman
c. Memiliki variabel dependen yang diketahui
d. Menggunakan aturan tertentu untuk memecahkan masalah
Jawaban: c
3. Algoritma Machine Learning yang cocok digunakan untuk memprediksi nilai kontinu adalah:
a. Logistic Regression
b. Decision Tree
c. K-Means
d. Linear Regression
Jawaban: d
4. Salah satu keuntungan dari menggunakan ensemble learning adalah:
a. Kemampuan untuk mengklasifikasikan data yang tidak terstruktur
b. Kemampuan untuk menangani dataset dengan dimensi tinggi
c. Kemampuan untuk mempercepat waktu komputasi
d. Kemampuan untuk meningkatkan akurasi prediksi
Jawaban: d
5. Proses pembagian dataset menjadi dua bagian, yaitu training set dan testing set, disebut:
a. Cross-validation
b. Feature extraction
c. Data augmentation
d. Data splitting
Jawaban: d
6. Algoritma Machine Learning yang digunakan untuk mengurutkan data adalah:
a. Naive Bayes
b. K-Means
c. Linear Regression
d. Support Vector Machine
Jawaban: b
7. Algoritma Machine Learning yang cocok untuk analisis klastering adalah:
a. Decision Tree
b. K-Means
c. Logistic Regression
d. Random Forest
Jawaban: b
8. Fungsi aktivasi yang sering digunakan dalam jaringan saraf tiruan (neural networks) adalah:
a. Sigmoid
b. ReLU
c. Tanh
d. Semua jawaban benar
Jawaban: d
9. Overfitting terjadi ketika:
a. Model Machine Learning gagal menghasilkan prediksi yang akurat
b. Model Machine Learning terlalu rumit dan terlalu cocok dengan data pelatihan
c. Model Machine Learning terlalu sederhana sehingga tidak dapat menangani masalah yang rumit
d. Model Machine Learning menghasilkan hasil yang konsisten tetapi tidak akurat
Jawaban: b
10. Salah satu teknik untuk mengurangi overfitting pada model Machine Learning adalah:
a. Data augmentation
b. Cross-validation
c. Regularisasi
d. Semua jawaban benar
Jawaban: d
11. Metode evaluasi yang digunakan untuk mengukur kinerja model klasifikasi adalah:
a. Confusion matrix
b. SSE (Sum of Squared Errors)
c. R-squared
d. Silhouette score
Jawaban: a
12. Support Vector Machine (SVM) digunakan untuk:
a. Klasifikasi dan regresi
b. Clustering
c. Prediksi nilai kontinu
d. Feature selection
Jawaban: a
13. K-fold cross-validation mengacu pada:
a. Metode pembagian dataset menjadi dua bagian: training set dan testing set
b. Metode pembagian dataset menjadi tiga bagian: training set, validation set, dan testing set
c. Metode evaluasi model dengan membagi dataset menjadi k subset yang sama ukurannya
d. Metode evaluasi model dengan menggunakan matriks konfusi
Jawaban: c
14. Salah satu algoritma Machine Learning yang populer untuk pengelompokan teks adalah:
a. K-Means
b. Naive Bayes
c. Decision Tree
d. Random Forest
Jawaban: b
15. Algoritma Random Forest digunakan untuk:
a. Klasifikasi dan regresi
b. Clustering
c. Prediksi nilai kontinu
d. Feature selection
Jawaban: a
16. Algoritma Machine Learning yang digunakan untuk deteksi anomali adalah:
a. Naive Bayes
b. K-Means
c. Random Forest
d. One-Class SVM
Jawaban: d
17. Algoritma Machine Learning yang digunakan untuk pengenalan pola dalam data adalah:
a. Decision Tree
b. K-Nearest Neighbors (KNN)
c. Linear Regression
d. Logistic Regression
Jawaban: b
18. Metode yang digunakan untuk mengukur tingkat ketidakmurnian dalam klastering adalah:
a. Precision
b. Recall
c. F1 score
d. Dunn Index
Jawaban: d
19. Deep learning adalah:
a. Metode Machine Learning yang menggunakan jaringan saraf tiruan dengan banyak lapisan
b. Metode Machine Learning yang menggabungkan beberapa model untuk meningkatkan akurasi prediksi
c. Metode Machine Learning yang menggunakan pohon keputusan untuk klasifikasi
d. Metode Machine Learning yang menggunakan algoritma genetika untuk optimisasi
Jawaban: a
20. Gradient descent adalah:
a. Algoritma untuk memaksimalkan fungsi objektif dalam Machine Learning
b. Algoritma untuk mencari garis terbaik yang memisahkan dua kelas dalam klasifikasi
c. Algoritma untuk meminimalkan fungsi objektif dalam Machine Learning
d. Algoritma untuk menggabungkan beberapa model dalam ensemble learning
Jawaban: c
21. Jaringan saraf tiruan yang memiliki satu lapisan tersembunyi disebut:
a. Perceptron
b. Multilayer Perceptron (MLP)
c. Deep Neural Network (DNN)
d. Convolutional Neural Network (CNN)
Jawaban: a
22. Algoritma yang digunakan untuk menghitung bobot yang optimal dalam jaringan saraf tiruan adalah:
a. Backpropagation
b. Gradient Boosting
c. AdaBoost
d. K-Means
Jawaban: a
23. Salah satu kelemahan dari algoritma K-Nearest Neighbors (KNN) adalah:
a. Sangat sensitif terhadap nilai pencilan (outlier)
b. Membutuhkan waktu komputasi yang lama saat jumlah data menjadi besar
c. Hanya cocok untuk data dengan fitur kategorikal
d. Tidak dapat digunakan untuk klasifikasi multikelas
Jawaban: b
24. Fungsi kerugian yang umum digunakan dalam regresi adalah:
a. Mean Squared Error (MSE)
b. Entropy
c. Gini Index
d. F1 score
Jawaban: a
25. Salah satu metode yang digunakan untuk menangani masalah kelas yang tidak seimbang dalam klasifikasi adalah:
a. SMOTE (Synthetic Minority Over-sampling Technique)
b. PCA (Principal Component Analysis)
c. AUC-ROC (Area Under the Receiver Operating Characteristic Curve)
d. RMSProp (Root Mean Square Propagation)
Jawaban: a
26. Salah satu keuntungan dari algoritma Naive Bayes adalah:
a. Tidak memerlukan waktu komputasi yang lama untuk melatih model
b. Cocok untuk data dengan banyak fitur dan dimensi tinggi
c. Mampu menangani masalah klasifikasi multikelas
d. Tidak terpengaruh oleh nilai pencilan (outlier)
Jawaban: a
27. Algoritma Machine Learning yang digunakan untuk reduksi dimensi adalah:
a. K-Means
b. Principal Component Analysis (PCA)
c. Support Vector Machine (SVM)
d. Random Forest
Jawaban: b
28. Salah satu metode ensemble learning yang menggunakan beberapa model dengan bobot yang sama adalah:
a. Bagging
b. Boosting
c. Stacking
d. Voting
Jawaban: d
29. Area Under the Curve (AUC) mengukur:
a. Akurasi prediksi model
b. Kualitas klastering
c. Kinerja model dalam klasifikasi biner
d. Kinerja model dalam klasifikasi multikelas
Jawaban: c
30. Algoritma yang digunakan untuk melakukan prediksi berdasarkan pendapat sekelompok "ahli" adalah:
a. K-Means
b. Random Forest
c. Gradient Boosting
d. AdaBoost
Jawaban: d
31. Salah satu teknik pengoptimalan yang digunakan dalam Machine Learning adalah:
a. Random search
b. Breadth-first search
c. Depth-first search
d. Linear search
Jawaban: a
32. Salah satu kelebihan algoritma Decision Tree adalah:
a. Tidak memerlukan banyak preprocessing pada data
b. Tidak terpengaruh oleh nilai pencilan (outlier)
c. Dapat menangani masalah klasifikasi multikelas secara langsung
d. Memiliki kecepatan komputasi yang sangat cepat
Jawaban: a
33. Salah satu metode pengelompokan yang menggunakan fungsi jarak untuk mengukur kedekatan antar data adalah:
a. K-Means
b. Decision Tree
c. Naive Bayes
d. Random Forest
Jawaban: a
34. Algoritma Machine Learning yang cocok untuk prediksi harga rumah berdasarkan fitur-fitur tertentu adalah:
a. K-Means
b. Linear Regression
c. Decision Tree
d. Naive Bayes
Jawaban: b
35. Salah satu keuntungan dari algoritma K-Means adalah:
a. Tidak memerlukan nilai awal yang disediakan oleh pengguna
b. Cocok untuk data dengan fitur kategorikal
c. Tidak terpengaruh oleh nilai pencilan (outlier)
d. Dapat menangani masalah klasifikasi multikelas secara langsung
Jawaban: c
36. Model Machine Learning yang "dilatih" dengan data historis untuk memprediksi data masa depan adalah contoh dari:
a. Klasifikasi
b. Regresi
c. Unsupervised learning
d. Reinforcement learning
Jawaban: b
37. Metode pengoptimalan yang umum digunakan untuk melatih jaringan saraf tiruan adalah:
a. Stochastic Gradient Descent (SGD)
b. K-Means
c. Random Forest
d. AdaBoost
Jawaban: a
38. Metode pengklasifikasian yang menghitung probabilitas terjadinya suatu kejadian berdasarkan frekuensi kemunculan nilai dalam data latih adalah:
a. Naive Bayes
b. K-Nearest Neighbors (KNN)
c. Support Vector Machine (SVM)
d. Random Forest
Jawaban: a
39. Salah satu kelemahan dari algoritma Random Forest adalah:
a. Memerlukan waktu komputasi yang lama saat jumlah pohon (tree) yang digunakan besar
b. Rentan terhadap overfitting saat jumlah data pelatihan terbatas
c. Tidak dapat mengatasi data yang memiliki fitur kategorikal
d. Hanya cocok untuk data dengan fitur numerik
Jawaban: a
40. Metode yang digunakan untuk mengatasi masalah kebisingan (noise) dalam data adalah:
a. Data scaling
b. Data imputation
c. Data normalization
d. Data smoothing
Jawaban: d
41. Salah satu metode evaluasi yang digunakan untuk mengukur kualitas klastering adalah:
a. F1 score
b. Silhouette score
c. R-squared
d. AUC-ROC
Jawaban: b
42. Algoritma Machine Learning yang digunakan untuk prediksi harga saham adalah:
a. K-Means
b. Linear Regression
c. Decision Tree
d. Recurrent Neural Network (RNN)
Jawaban: d
43. Salah satu teknik pengklasifikasian yang menggunakan sekumpulan pohon keputusan adalah:
a. Naive Bayes
b. Support Vector Machine (SVM)
c. Random Forest
d. K-Nearest Neighbors (KNN)
Jawaban: c
44. Algoritma yang digunakan untuk mengurutkan data berdasarkan preferensi pengguna adalah:
a. Naive Bayes
b. Collaborative Filtering
c. Logistic Regression
d. Decision Tree
Jawaban: b
45. Salah satu keuntungan dari menggunakan algoritma Support Vector Machine (SVM) adalah:
a. Tidak memerlukan banyak preprocessing pada data
b. Mampu menangani masalah klasifikasi multikelas secara langsung
c. Memiliki interpretabilitas yang tinggi
d. Efektif dalam mengatasi masalah overfitting
Jawaban: d
46. Algoritma Machine Learning yang digunakan untuk klasifikasi berdasarkan aturan-aturan logika adalah:
a. Naive Bayes
b. Decision Tree
c. K-Nearest Neighbors (KNN)
d. Linear Regression
Jawaban: b
47. Salah satu keuntungan dari algoritma Linear Regression adalah:
a. Cocok untuk data dengan banyak fitur dan dimensi tinggi
b. Tidak terpengaruh oleh nilai pencilan (outlier)
c. Memiliki interpretabilitas yang tinggi
d. Mampu menangani masalah klasifikasi multikelas secara langsung
Jawaban: c
48. Algoritma Machine Learning yang digunakan untuk klasifikasi gambar adalah:
a. Naive Bayes
b. K-Means
c. Convolutional Neural Network (CNN)
d. Random Forest
Jawaban: c
49. Salah satu metode yang digunakan untuk meningkatkan generalisasi model Machine Learning adalah:
a. Data augmentation
b. Feature selection
c. Regularisasi
d. Semua jawaban benar
Jawaban: d
50. Salah satu teknik yang digunakan untuk mengevaluasi model Machine Learning dalam tugas regresi adalah:
a. R-squared
b. Precision
c. F1 score
d. AUC-ROC
Jawaban: a