49 Soal Praktikum Temu Balik Informasi Beserta Jawaban
Kumpulan Soal Pilihan Ganda Materi Praktikum Temu Balik Informasi
Soal 1: Apa tujuan utama dari praktikum Temu Balik Informasi?
a) Mencari informasi yang relevan dari koleksi dokumen
b) Mengenkripsi data sensitif
c) Menganalisis data statistik
d) Mendesain antarmuka pengguna
Jawaban: a) Mencari informasi yang relevan dari koleksi dokumen
Soal 2: Apa yang dimaksud dengan istilah "Query" dalam konteks Temu Balik Informasi?
a) Sebuah dokumen yang ingin dicari
b) Proses mengubah data menjadi informasi
c) Kata atau kalimat yang digunakan untuk mencari informasi
d) Metode enkripsi data
Jawaban: c) Kata atau kalimat yang digunakan untuk mencari informasi
Soal 3: Manakah di antara berikut yang merupakan metrik umum dalam mengevaluasi sistem Temu Balik Informasi?
a) Kepadatan populasi
b) Ketersediaan server
c) Presisi dan perolehan
d) Kekuatan enkripsi
Jawaban: c) Presisi dan perolehan
Soal 4: Dokumen yang ditemukan oleh sistem Temu Balik Informasi tetapi sebenarnya tidak relevan dengan query memiliki istilah apa?
a) True positive
b) False positive
c) True negative
d) False negative
Jawaban: b) False positive
Soal 5: Apa yang dimaksud dengan istilah "Stemming" dalam konteks Temu Balik Informasi?
a) Proses menghapus kata-kata tidak penting dari query
b) Proses menggabungkan beberapa query menjadi satu
c) Proses mengubah kata-kata menjadi bentuk dasarnya
d) Proses mengurutkan dokumen berdasarkan relevansi
Jawaban: c) Proses mengubah kata-kata menjadi bentuk dasarnya
Soal 6: Mana yang merupakan contoh algoritma Temu Balik Informasi berbasis aturan?
a) TF-IDF
b) PageRank
c) Boolean model
d) K-Means
Jawaban: c) Boolean model
Soal 7: Apa yang diukur oleh skor TF-IDF dalam Temu Balik Informasi?
a) Relevansi antara query dan dokumen
b) Jumlah kata dalam dokumen
c) Usia dokumen
d) Kepadatan populasi
Jawaban: a) Relevansi antara query dan dokumen
Soal 8: Algoritma PageRank digunakan terutama untuk apa dalam Temu Balik Informasi?
a) Menghitung frekuensi kata dalam dokumen
b) Mengurutkan hasil pencarian berdasarkan relevansi
c) Menghitung popularitas halaman web
d) Mengelompokkan dokumen menjadi cluster
Jawaban: c) Menghitung popularitas halaman web
Soal 9: Dalam evaluasi Temu Balik Informasi, presisi dihitung sebagai:
a) True Positives / (True Positives + False Positives)
b) True Positives / (True Positives + False Negatives)
c) True Negatives / (True Negatives + False Negatives)
d) True Negatives / (True Negatives + False Positives)
Jawaban: a) True Positives / (True Positives + False Positives)
Soal 10: Metode Temu Balik Informasi "Vector Space Model" menggambarkan dokumen dan query sebagai apa?
a) Daftar kata kunci
b) Vektor dalam ruang multidimensional
c) Graf berhubungan
d) Pohon sintaks
Jawaban: b) Vektor dalam ruang multidimensional
Soal 11: Algoritma "Cosine Similarity" digunakan untuk mengukur apa dalam Temu Balik Informasi?
a) Kesamaan antara dua vektor dokumen
b) Kesamaan antara query dan dokumen
c) Kesamaan antara dua query
d) Kesamaan antara dokumen dan halaman web
Jawaban: b) Kesamaan antara query dan dokumen
Soal 12: Manakah di antara berikut yang bukan merupakan tahap dalam proses Temu Balik Informasi?
a) Evaluasi
b) Indeksasi
c) Pengujian A/B
d) Preprocessing
Jawaban: c) Pengujian A/B
Soal 13: "Term Frequency" mengukur apa dalam Temu Balik Informasi?
a) Jumlah kata dalam query
b) Frekuensi sebuah kata dalam dokumen
c) Kesamaan antara dua dokumen
d) Waktu yang dibutuhkan untuk pencarian
Jawaban: b) Frekuensi sebuah kata dalam dokumen
Soal 14: Metode "Okapi BM25" adalah algoritma yang digunakan untuk apa dalam Temu Balik Informasi?
a) Mengurutkan hasil pencarian berdasarkan relevansi
b) Menghitung jumlah total kata dalam koleksi dokumen
c) Menganalisis struktur sintaks dalam dokumen
d) Menentukan popularitas halaman web
Jawaban: a) Mengurutkan hasil pencarian berdasarkan relevansi
Soal 15: Pada model Temu Balik Informasi, apa itu "recall"?
a) Proporsi dokumen relevan yang ditemukan oleh sistem
b) Proporsi dokumen tidak relevan yang ditemukan oleh sistem
c) Proporsi dokumen relevan dalam koleksi keseluruhan
d) Proporsi query yang relevan
Jawaban: a) Proporsi dokumen relevan yang ditemukan oleh sistem
Soal 16: Manakah yang merupakan contoh fitur dalam ekstraksi fitur dalam Temu Balik Informasi?
a) Pengurutan kata
b) Jumlah total halaman web
c) Jumlah pengguna internet
d) Posisi geografis
Jawaban: a) Pengurutan kata
Soal 17: Dalam indeks inverted, apa yang disimpan?
a) Daftar dokumen dengan kata-kata unik
b) Daftar query dengan kata-kata unik
c) Daftar kata-kata dengan dokumen unik
d) Daftar halaman web dengan kata-kata unik
Jawaban: a) Daftar dokumen dengan kata-kata unik
Soal 18: Model probabilitas yang digunakan dalam Temu Balik Informasi untuk menghitung probabilitas dokumen terkait dengan query adalah?
a) Model K-Means
b) Model Probabilistik
c) Model PageRank
d) Model TF-IDF
Jawaban: b) Model Probabilistik
Soal 19: Mengapa diversifikasi hasil pencarian penting dalam Temu Balik Informasi?
a) Untuk mengurutkan hasil berdasarkan relevansi
b) Untuk mencakup berbagai jenis informasi dalam hasil
c) Untuk mengurangi jumlah query yang diajukan
d) Untuk memastikan semua dokumen terindeks
Jawaban: b) Untuk mencakup berbagai jenis informasi dalam hasil
Soal 20: Algoritma "Latent Semantic Analysis (LSA)" dalam Temu Balik Informasi mengatasi masalah apa?
a) Overfitting dalam model
b) Kelebihan kata dalam query
c) Masalah indeksasi dokumen
d) Masalah makna yang tersembunyi dalam kata
Jawaban: d) Masalah makna yang tersembunyi dalam kata
Soal 21: Algoritma "Latent Dirichlet Allocation (LDA)" digunakan dalam konteks Temu Balik Informasi untuk tujuan apa?
a) Mengevaluasi presisi sistem
b) Menganalisis statistik data
c) Mengelompokkan dokumen dalam tema yang tersembunyi
d) Menghitung frekuensi kata dalam query
Jawaban: c) Mengelompokkan dokumen dalam tema yang tersembunyi
Soal 22: Pada model jaringan saraf tiruan dalam Temu Balik Informasi, layer mana yang bertanggung jawab untuk ekstraksi fitur?
a) Input layer
b) Hidden layer
c) Output layer
d) Preprocessing layer
Jawaban: b) Hidden layer
Soal 23: "Precision at k" adalah metrik evaluasi yang mengukur apa dalam Temu Balik Informasi?
a) Jumlah dokumen dalam koleksi
b) Presisi pada peringkat k
c) Recall pada peringkat k
d) Jumlah query dalam koleksi
Jawaban: b) Presisi pada peringkat k
Soal 24: Dalam Temu Balik Informasi, apa yang dimaksud dengan "stop words"?
a) Kata-kata yang digunakan untuk merujuk kata lainnya
b) Kata-kata yang memiliki makna khusus
c) Kata-kata yang dianggap tidak penting dalam pencarian
d) Kata-kata dalam bahasa lain yang digunakan dalam query
Jawaban: c) Kata-kata yang dianggap tidak penting dalam pencarian
Soal 25: Manakah di antara berikut yang bukan merupakan metode pengukuran relevansi dalam Temu Balik Informasi?
a) Precision
b) Recall
c) Accuracy
d) F1-score
Jawaban: c) Accuracy
Soal 26: Dalam model Temu Balik Informasi, apa itu "inverted index"?
a) Daftar dokumen yang relevan dengan query
b) Daftar query yang relevan dengan dokumen
c) Daftar kata-kata dengan dokumen yang mengandungnya
d) Daftar kata-kata yang tidak relevan
Jawaban: c) Daftar kata-kata dengan dokumen yang mengandungnya
Soal 27: "Query expansion" dalam Temu Balik Informasi mengacu pada proses apa?
a) Membuat query yang lebih singkat
b) Menggabungkan beberapa query menjadi satu
c) Memperluas kata-kata dalam query untuk mencakup sinonim atau terkait
d) Mengganti kata-kata dalam query dengan kata-kata lain
Jawaban: c) Memperluas kata-kata dalam query untuk mencakup sinonim atau terkait
Soal 28: Metode "Rocchio Relevance Feedback" dalam Temu Balik Informasi digunakan untuk tujuan apa?
a) Menghitung skor TF-IDF
b) Mengurutkan hasil pencarian berdasarkan popularitas
c) Meningkatkan relevansi hasil pencarian dengan memanfaatkan umpan balik dari pengguna
d) Mengubah query menjadi bentuk dasar
Jawaban: c) Meningkatkan relevansi hasil pencarian dengan memanfaatkan umpan balik dari pengguna
Soal 29: Dalam Temu Balik Informasi, apa yang dimaksud dengan "term weighting"?
a) Proses mengubah query menjadi bentuk dasarnya
b) Proses menghitung jumlah kata dalam dokumen
c) Proses memberikan bobot pada kata-kata dalam query atau dokumen
d) Proses mengurutkan hasil pencarian
Jawaban: c) Proses memberikan bobot pada kata-kata dalam query atau dokumen
Soal 30: Manakah di antara berikut yang bukan merupakan tahap dalam algoritma PageRank?
a) Menghitung "authority" dari halaman web
b) Menghitung "hub" dari halaman web
c) Menghitung skor TF-IDF
d) Menghitung skor kelayakan halaman
Jawaban: c) Menghitung skor TF-IDF
Soal 31: Apa yang dimaksud dengan "Relevance Feedback" dalam konteks Temu Balik Informasi?
a) Proses mengurutkan hasil pencarian berdasarkan popularitas
b) Proses mengubah query menjadi bentuk dasar
c) Proses meningkatkan relevansi hasil pencarian dengan memanfaatkan umpan balik dari pengguna
d) Proses menghitung bobot TF-IDF
Jawaban: c) Proses meningkatkan relevansi hasil pencarian dengan memanfaatkan umpan balik dari pengguna
Soal 32: Algoritma "HITS" (Hyperlink-Induced Topic Search) digunakan dalam Temu Balik Informasi untuk tujuan apa?
a) Menghitung frekuensi kata dalam dokumen
b) Menghitung popularitas halaman web
c) Menghitung skor TF-IDF
d) Menghitung jarak antara kata dalam query
Jawaban: b) Menghitung popularitas halaman web
Soal 33: Dalam model Temu Balik Informasi, apa itu "Query Likelihood Model"?
a) Model yang menghitung kesamaan antara query dan dokumen
b) Model yang mengukur popularitas halaman web
c) Model yang memprediksi query yang akan diajukan pengguna
d) Model yang memprediksi waktu query diajukan
Jawaban: a) Model yang menghitung kesamaan antara query dan dokumen
Soal 34: Metode "Term Frequency-Inverse Document Frequency (TF-IDF)" adalah metode yang digunakan untuk apa dalam Temu Balik Informasi?
a) Menghitung jumlah kata dalam dokumen
b) Mengurutkan hasil pencarian berdasarkan popularitas
c) Mengukur popularitas halaman web
d) Mengukur relevansi antara kata dalam query dan dokumen
Jawaban: d) Mengukur relevansi antara kata dalam query dan dokumen
Soal 35: Dalam model "Vector Space Model" dalam Temu Balik Informasi, bagaimana vektor dokumen dan query direpresentasikan?
a) Sebagai angka biner
b) Sebagai deretan kata-kata unik
c) Sebagai graf berhubungan
d) Sebagai vektor dalam ruang multidimensional
Jawaban: d) Sebagai vektor dalam ruang multidimensional
Soal 36: Algoritma "Okapi BM25" mengatasi masalah apa yang tidak diatasi oleh model "TF-IDF"?
a) Overfitting dalam model
b) Kelebihan kata dalam query
c) Ketidakseimbangan antara panjang dokumen
d) Kekurangan kata dalam query
Jawaban: c) Ketidakseimbangan antara panjang dokumen
Soal 37: Dalam model Temu Balik Informasi, apa yang dimaksud dengan "mean average precision" (MAP)?
a) Rata-rata nilai presisi dari beberapa query
b) Nilai presisi rata-rata dari seluruh dokumen
c) Rata-rata jumlah dokumen yang ditemukan oleh sistem
d) Rata-rata popularitas halaman web
Jawaban: a) Rata-rata nilai presisi dari beberapa query
Soal 38: Algoritma "BM25F" adalah variasi dari algoritma apa dalam Temu Balik Informasi?
a) TF-IDF
b) PageRank
c) Okapi BM25
d) Latent Dirichlet Allocation (LDA)
Jawaban: c) Okapi BM25
Soal 39: Dalam Temu Balik Informasi, apa itu "query intent"?
a) Niat atau tujuan pengguna dalam mengajukan query
b) Jumlah kata dalam query
c) Urutan kata dalam query
d) Penggunaan sinonim dalam query
Jawaban: a) Niat atau tujuan pengguna dalam mengajukan query
Soal 40: Dalam konteks Temu Balik Informasi, apa yang dimaksud dengan "retrieval model"?
a) Model yang mengukur popularitas halaman web
b) Model yang menghitung skor TF-IDF
c) Model yang mengukur presisi dan recall
d) Model yang menggambarkan bagaimana dokumen diambil dari koleksi berdasarkan query
Jawaban: d) Model yang menggambarkan bagaimana dokumen diambil dari koleksi berdasarkan query
Soal 41: Dalam konteks Temu Balik Informasi, apa yang dimaksud dengan "relevance judgment"?
a) Proses evaluasi dokumen berdasarkan popularitas
b) Proses penentuan urutan halaman web dalam indeks
c) Proses penilaian seberapa relevan dokumen terhadap query
d) Proses mengurutkan kata-kata dalam query
Jawaban: c) Proses penilaian seberapa relevan dokumen terhadap query
Soal 42: Manakah di antara berikut yang bukan merupakan metode evaluasi Temu Balik Informasi?
a) Precision-Recall curve
b) F-measure
c) Area Under the Curve (AUC)
d) Text preprocessing
Jawaban: d) Text preprocessing
Soal 43: Dalam model probabilistik untuk Temu Balik Informasi, "prior probability" merujuk pada apa?
a) Probabilitas bahwa dokumen tersebut relevan sebelum melihat query
b) Probabilitas bahwa dokumen tersebut relevan setelah melihat query
c) Probabilitas bahwa dokumen tersebut tidak relevan sebelum melihat query
d) Probabilitas bahwa dokumen tersebut tidak relevan setelah melihat query
Jawaban: a) Probabilitas bahwa dokumen tersebut relevan sebelum melihat query
Soal 44: Algoritma "Positional Index" dalam Temu Balik Informasi memperhitungkan apa?
a) Urutan kata-kata dalam query
b) Panjang dokumen
c) Popularitas halaman web
d) Waktu query diajukan
Jawaban: a) Urutan kata-kata dalam query
Soal 45: Dalam algoritma PageRank, apa yang dimaksud dengan "damping factor"?
a) Faktor yang mengurangi popularitas halaman web
b) Faktor yang mengurangi skor TF-IDF
c) Faktor yang mengurangi jumlah query
d) Faktor yang mengurangi efek link pada popularitas halaman web
Jawaban: d) Faktor yang mengurangi efek link pada popularitas halaman web
Soal 46: Metode "InQuery" dalam Temu Balik Informasi menggabungkan apa?
a) Query dan hasil pencarian
b) Query dan jumlah kata dalam query
c) Query dan panjang dokumen
d) Query dan popularitas halaman web
Jawaban: a) Query dan hasil pencarian
Soal 47: Dalam model Temu Balik Informasi, "precision-recall trade-off" merujuk pada apa?
a) Keseimbangan antara popularitas halaman web dan relevansi
b) Keseimbangan antara popularitas dan panjang dokumen
c) Kompromi antara nilai presisi dan recall
d) Kompromi antara jumlah query dan hasil pencarian
Jawaban: c) Kompromi antara nilai presisi dan recall
Soal 48: Algoritma "SALSA" (Scalable Approach to Link Structure Analysis) digunakan untuk tujuan apa dalam Temu Balik Informasi?
a) Mengukur popularitas halaman web
b) Menghitung skor TF-IDF
c) Menganalisis struktur tautan antara halaman web
d) Menghitung frekuensi kata dalam dokumen
Jawaban: c) Menganalisis struktur tautan antara halaman web
Soal 49: Dalam model Temu Balik Informasi, apa itu "Precision at N"?
a) Nilai presisi pada peringkat N
b) Nilai recall pada peringkat N
c) Jumlah dokumen relevan pada peringkat N
d) Jumlah query pada peringkat N
Jawaban: a) Nilai presisi pada peringkat N