49 Soal Praktikum Temu Balik Informasi Beserta Jawaban

Kumpulan Soal Pilihan Ganda Materi Praktikum Temu Balik Informasi

Soal 1: Apa tujuan utama dari praktikum Temu Balik Informasi?
a) Mencari informasi yang relevan dari koleksi dokumen
b) Mengenkripsi data sensitif
c) Menganalisis data statistik
d) Mendesain antarmuka pengguna

Jawaban: a) Mencari informasi yang relevan dari koleksi dokumen

Soal 2: Apa yang dimaksud dengan istilah "Query" dalam konteks Temu Balik Informasi?
a) Sebuah dokumen yang ingin dicari
b) Proses mengubah data menjadi informasi
c) Kata atau kalimat yang digunakan untuk mencari informasi
d) Metode enkripsi data

Jawaban: c) Kata atau kalimat yang digunakan untuk mencari informasi

Soal 3: Manakah di antara berikut yang merupakan metrik umum dalam mengevaluasi sistem Temu Balik Informasi?
a) Kepadatan populasi
b) Ketersediaan server
c) Presisi dan perolehan
d) Kekuatan enkripsi

Jawaban: c) Presisi dan perolehan

Soal 4: Dokumen yang ditemukan oleh sistem Temu Balik Informasi tetapi sebenarnya tidak relevan dengan query memiliki istilah apa?
a) True positive
b) False positive
c) True negative
d) False negative

Jawaban: b) False positive

Soal 5: Apa yang dimaksud dengan istilah "Stemming" dalam konteks Temu Balik Informasi?
a) Proses menghapus kata-kata tidak penting dari query
b) Proses menggabungkan beberapa query menjadi satu
c) Proses mengubah kata-kata menjadi bentuk dasarnya
d) Proses mengurutkan dokumen berdasarkan relevansi

Jawaban: c) Proses mengubah kata-kata menjadi bentuk dasarnya

Soal 6: Mana yang merupakan contoh algoritma Temu Balik Informasi berbasis aturan?
a) TF-IDF
b) PageRank
c) Boolean model
d) K-Means

Jawaban: c) Boolean model

Soal 7: Apa yang diukur oleh skor TF-IDF dalam Temu Balik Informasi?
a) Relevansi antara query dan dokumen
b) Jumlah kata dalam dokumen
c) Usia dokumen
d) Kepadatan populasi

Jawaban: a) Relevansi antara query dan dokumen

Soal 8: Algoritma PageRank digunakan terutama untuk apa dalam Temu Balik Informasi?
a) Menghitung frekuensi kata dalam dokumen
b) Mengurutkan hasil pencarian berdasarkan relevansi
c) Menghitung popularitas halaman web
d) Mengelompokkan dokumen menjadi cluster

Jawaban: c) Menghitung popularitas halaman web

Soal 9: Dalam evaluasi Temu Balik Informasi, presisi dihitung sebagai:
a) True Positives / (True Positives + False Positives)
b) True Positives / (True Positives + False Negatives)
c) True Negatives / (True Negatives + False Negatives)
d) True Negatives / (True Negatives + False Positives)

Jawaban: a) True Positives / (True Positives + False Positives)

Soal 10: Metode Temu Balik Informasi "Vector Space Model" menggambarkan dokumen dan query sebagai apa?
a) Daftar kata kunci
b) Vektor dalam ruang multidimensional
c) Graf berhubungan
d) Pohon sintaks

Jawaban: b) Vektor dalam ruang multidimensional

Soal 11: Algoritma "Cosine Similarity" digunakan untuk mengukur apa dalam Temu Balik Informasi?
a) Kesamaan antara dua vektor dokumen
b) Kesamaan antara query dan dokumen
c) Kesamaan antara dua query
d) Kesamaan antara dokumen dan halaman web

Jawaban: b) Kesamaan antara query dan dokumen

Soal 12: Manakah di antara berikut yang bukan merupakan tahap dalam proses Temu Balik Informasi?
a) Evaluasi
b) Indeksasi
c) Pengujian A/B
d) Preprocessing

Jawaban: c) Pengujian A/B

Soal 13: "Term Frequency" mengukur apa dalam Temu Balik Informasi?
a) Jumlah kata dalam query
b) Frekuensi sebuah kata dalam dokumen
c) Kesamaan antara dua dokumen
d) Waktu yang dibutuhkan untuk pencarian

Jawaban: b) Frekuensi sebuah kata dalam dokumen

Soal 14: Metode "Okapi BM25" adalah algoritma yang digunakan untuk apa dalam Temu Balik Informasi?
a) Mengurutkan hasil pencarian berdasarkan relevansi
b) Menghitung jumlah total kata dalam koleksi dokumen
c) Menganalisis struktur sintaks dalam dokumen
d) Menentukan popularitas halaman web

Jawaban: a) Mengurutkan hasil pencarian berdasarkan relevansi

Soal 15: Pada model Temu Balik Informasi, apa itu "recall"?
a) Proporsi dokumen relevan yang ditemukan oleh sistem
b) Proporsi dokumen tidak relevan yang ditemukan oleh sistem
c) Proporsi dokumen relevan dalam koleksi keseluruhan
d) Proporsi query yang relevan

Jawaban: a) Proporsi dokumen relevan yang ditemukan oleh sistem

Soal 16: Manakah yang merupakan contoh fitur dalam ekstraksi fitur dalam Temu Balik Informasi?
a) Pengurutan kata
b) Jumlah total halaman web
c) Jumlah pengguna internet
d) Posisi geografis

Jawaban: a) Pengurutan kata

Soal 17: Dalam indeks inverted, apa yang disimpan?
a) Daftar dokumen dengan kata-kata unik
b) Daftar query dengan kata-kata unik
c) Daftar kata-kata dengan dokumen unik
d) Daftar halaman web dengan kata-kata unik

Jawaban: a) Daftar dokumen dengan kata-kata unik

Soal 18: Model probabilitas yang digunakan dalam Temu Balik Informasi untuk menghitung probabilitas dokumen terkait dengan query adalah?
a) Model K-Means
b) Model Probabilistik
c) Model PageRank
d) Model TF-IDF

Jawaban: b) Model Probabilistik

Soal 19: Mengapa diversifikasi hasil pencarian penting dalam Temu Balik Informasi?
a) Untuk mengurutkan hasil berdasarkan relevansi
b) Untuk mencakup berbagai jenis informasi dalam hasil
c) Untuk mengurangi jumlah query yang diajukan
d) Untuk memastikan semua dokumen terindeks

Jawaban: b) Untuk mencakup berbagai jenis informasi dalam hasil

Soal 20: Algoritma "Latent Semantic Analysis (LSA)" dalam Temu Balik Informasi mengatasi masalah apa?
a) Overfitting dalam model
b) Kelebihan kata dalam query
c) Masalah indeksasi dokumen
d) Masalah makna yang tersembunyi dalam kata

Jawaban: d) Masalah makna yang tersembunyi dalam kata

Soal 21: Algoritma "Latent Dirichlet Allocation (LDA)" digunakan dalam konteks Temu Balik Informasi untuk tujuan apa?
a) Mengevaluasi presisi sistem
b) Menganalisis statistik data
c) Mengelompokkan dokumen dalam tema yang tersembunyi
d) Menghitung frekuensi kata dalam query

Jawaban: c) Mengelompokkan dokumen dalam tema yang tersembunyi

Soal 22: Pada model jaringan saraf tiruan dalam Temu Balik Informasi, layer mana yang bertanggung jawab untuk ekstraksi fitur?
a) Input layer
b) Hidden layer
c) Output layer
d) Preprocessing layer

Jawaban: b) Hidden layer

Soal 23: "Precision at k" adalah metrik evaluasi yang mengukur apa dalam Temu Balik Informasi?
a) Jumlah dokumen dalam koleksi
b) Presisi pada peringkat k
c) Recall pada peringkat k
d) Jumlah query dalam koleksi

Jawaban: b) Presisi pada peringkat k

Soal 24: Dalam Temu Balik Informasi, apa yang dimaksud dengan "stop words"?
a) Kata-kata yang digunakan untuk merujuk kata lainnya
b) Kata-kata yang memiliki makna khusus
c) Kata-kata yang dianggap tidak penting dalam pencarian
d) Kata-kata dalam bahasa lain yang digunakan dalam query

Jawaban: c) Kata-kata yang dianggap tidak penting dalam pencarian

Soal 25: Manakah di antara berikut yang bukan merupakan metode pengukuran relevansi dalam Temu Balik Informasi?
a) Precision
b) Recall
c) Accuracy
d) F1-score

Jawaban: c) Accuracy

Soal 26: Dalam model Temu Balik Informasi, apa itu "inverted index"?
a) Daftar dokumen yang relevan dengan query
b) Daftar query yang relevan dengan dokumen
c) Daftar kata-kata dengan dokumen yang mengandungnya
d) Daftar kata-kata yang tidak relevan

Jawaban: c) Daftar kata-kata dengan dokumen yang mengandungnya

Soal 27: "Query expansion" dalam Temu Balik Informasi mengacu pada proses apa?
a) Membuat query yang lebih singkat
b) Menggabungkan beberapa query menjadi satu
c) Memperluas kata-kata dalam query untuk mencakup sinonim atau terkait
d) Mengganti kata-kata dalam query dengan kata-kata lain

Jawaban: c) Memperluas kata-kata dalam query untuk mencakup sinonim atau terkait

Soal 28: Metode "Rocchio Relevance Feedback" dalam Temu Balik Informasi digunakan untuk tujuan apa?
a) Menghitung skor TF-IDF
b) Mengurutkan hasil pencarian berdasarkan popularitas
c) Meningkatkan relevansi hasil pencarian dengan memanfaatkan umpan balik dari pengguna
d) Mengubah query menjadi bentuk dasar

Jawaban: c) Meningkatkan relevansi hasil pencarian dengan memanfaatkan umpan balik dari pengguna

Soal 29: Dalam Temu Balik Informasi, apa yang dimaksud dengan "term weighting"?
a) Proses mengubah query menjadi bentuk dasarnya
b) Proses menghitung jumlah kata dalam dokumen
c) Proses memberikan bobot pada kata-kata dalam query atau dokumen
d) Proses mengurutkan hasil pencarian

Jawaban: c) Proses memberikan bobot pada kata-kata dalam query atau dokumen

Soal 30: Manakah di antara berikut yang bukan merupakan tahap dalam algoritma PageRank?
a) Menghitung "authority" dari halaman web
b) Menghitung "hub" dari halaman web
c) Menghitung skor TF-IDF
d) Menghitung skor kelayakan halaman

Jawaban: c) Menghitung skor TF-IDF

Soal 31: Apa yang dimaksud dengan "Relevance Feedback" dalam konteks Temu Balik Informasi?
a) Proses mengurutkan hasil pencarian berdasarkan popularitas
b) Proses mengubah query menjadi bentuk dasar
c) Proses meningkatkan relevansi hasil pencarian dengan memanfaatkan umpan balik dari pengguna
d) Proses menghitung bobot TF-IDF

Jawaban: c) Proses meningkatkan relevansi hasil pencarian dengan memanfaatkan umpan balik dari pengguna

Soal 32: Algoritma "HITS" (Hyperlink-Induced Topic Search) digunakan dalam Temu Balik Informasi untuk tujuan apa?
a) Menghitung frekuensi kata dalam dokumen
b) Menghitung popularitas halaman web
c) Menghitung skor TF-IDF
d) Menghitung jarak antara kata dalam query

Jawaban: b) Menghitung popularitas halaman web

Soal 33: Dalam model Temu Balik Informasi, apa itu "Query Likelihood Model"?
a) Model yang menghitung kesamaan antara query dan dokumen
b) Model yang mengukur popularitas halaman web
c) Model yang memprediksi query yang akan diajukan pengguna
d) Model yang memprediksi waktu query diajukan

Jawaban: a) Model yang menghitung kesamaan antara query dan dokumen

Soal 34: Metode "Term Frequency-Inverse Document Frequency (TF-IDF)" adalah metode yang digunakan untuk apa dalam Temu Balik Informasi?
a) Menghitung jumlah kata dalam dokumen
b) Mengurutkan hasil pencarian berdasarkan popularitas
c) Mengukur popularitas halaman web
d) Mengukur relevansi antara kata dalam query dan dokumen

Jawaban: d) Mengukur relevansi antara kata dalam query dan dokumen

Soal 35: Dalam model "Vector Space Model" dalam Temu Balik Informasi, bagaimana vektor dokumen dan query direpresentasikan?
a) Sebagai angka biner
b) Sebagai deretan kata-kata unik
c) Sebagai graf berhubungan
d) Sebagai vektor dalam ruang multidimensional

Jawaban: d) Sebagai vektor dalam ruang multidimensional

Soal 36: Algoritma "Okapi BM25" mengatasi masalah apa yang tidak diatasi oleh model "TF-IDF"?
a) Overfitting dalam model
b) Kelebihan kata dalam query
c) Ketidakseimbangan antara panjang dokumen
d) Kekurangan kata dalam query

Jawaban: c) Ketidakseimbangan antara panjang dokumen

Soal 37: Dalam model Temu Balik Informasi, apa yang dimaksud dengan "mean average precision" (MAP)?
a) Rata-rata nilai presisi dari beberapa query
b) Nilai presisi rata-rata dari seluruh dokumen
c) Rata-rata jumlah dokumen yang ditemukan oleh sistem
d) Rata-rata popularitas halaman web

Jawaban: a) Rata-rata nilai presisi dari beberapa query

Soal 38: Algoritma "BM25F" adalah variasi dari algoritma apa dalam Temu Balik Informasi?
a) TF-IDF
b) PageRank
c) Okapi BM25
d) Latent Dirichlet Allocation (LDA)

Jawaban: c) Okapi BM25

Soal 39: Dalam Temu Balik Informasi, apa itu "query intent"?
a) Niat atau tujuan pengguna dalam mengajukan query
b) Jumlah kata dalam query
c) Urutan kata dalam query
d) Penggunaan sinonim dalam query

Jawaban: a) Niat atau tujuan pengguna dalam mengajukan query

Soal 40: Dalam konteks Temu Balik Informasi, apa yang dimaksud dengan "retrieval model"?
a) Model yang mengukur popularitas halaman web
b) Model yang menghitung skor TF-IDF
c) Model yang mengukur presisi dan recall
d) Model yang menggambarkan bagaimana dokumen diambil dari koleksi berdasarkan query

Jawaban: d) Model yang menggambarkan bagaimana dokumen diambil dari koleksi berdasarkan query

Soal 41: Dalam konteks Temu Balik Informasi, apa yang dimaksud dengan "relevance judgment"?
a) Proses evaluasi dokumen berdasarkan popularitas
b) Proses penentuan urutan halaman web dalam indeks
c) Proses penilaian seberapa relevan dokumen terhadap query
d) Proses mengurutkan kata-kata dalam query

Jawaban: c) Proses penilaian seberapa relevan dokumen terhadap query

Soal 42: Manakah di antara berikut yang bukan merupakan metode evaluasi Temu Balik Informasi?
a) Precision-Recall curve
b) F-measure
c) Area Under the Curve (AUC)
d) Text preprocessing

Jawaban: d) Text preprocessing

Soal 43: Dalam model probabilistik untuk Temu Balik Informasi, "prior probability" merujuk pada apa?
a) Probabilitas bahwa dokumen tersebut relevan sebelum melihat query
b) Probabilitas bahwa dokumen tersebut relevan setelah melihat query
c) Probabilitas bahwa dokumen tersebut tidak relevan sebelum melihat query
d) Probabilitas bahwa dokumen tersebut tidak relevan setelah melihat query

Jawaban: a) Probabilitas bahwa dokumen tersebut relevan sebelum melihat query

Soal 44: Algoritma "Positional Index" dalam Temu Balik Informasi memperhitungkan apa?
a) Urutan kata-kata dalam query
b) Panjang dokumen
c) Popularitas halaman web
d) Waktu query diajukan

Jawaban: a) Urutan kata-kata dalam query

Soal 45: Dalam algoritma PageRank, apa yang dimaksud dengan "damping factor"?
a) Faktor yang mengurangi popularitas halaman web
b) Faktor yang mengurangi skor TF-IDF
c) Faktor yang mengurangi jumlah query
d) Faktor yang mengurangi efek link pada popularitas halaman web

Jawaban: d) Faktor yang mengurangi efek link pada popularitas halaman web

Soal 46: Metode "InQuery" dalam Temu Balik Informasi menggabungkan apa?
a) Query dan hasil pencarian
b) Query dan jumlah kata dalam query
c) Query dan panjang dokumen
d) Query dan popularitas halaman web

Jawaban: a) Query dan hasil pencarian

Soal 47: Dalam model Temu Balik Informasi, "precision-recall trade-off" merujuk pada apa?
a) Keseimbangan antara popularitas halaman web dan relevansi
b) Keseimbangan antara popularitas dan panjang dokumen
c) Kompromi antara nilai presisi dan recall
d) Kompromi antara jumlah query dan hasil pencarian

Jawaban: c) Kompromi antara nilai presisi dan recall

Soal 48: Algoritma "SALSA" (Scalable Approach to Link Structure Analysis) digunakan untuk tujuan apa dalam Temu Balik Informasi?
a) Mengukur popularitas halaman web
b) Menghitung skor TF-IDF
c) Menganalisis struktur tautan antara halaman web
d) Menghitung frekuensi kata dalam dokumen

Jawaban: c) Menganalisis struktur tautan antara halaman web

Soal 49: Dalam model Temu Balik Informasi, apa itu "Precision at N"?
a) Nilai presisi pada peringkat N
b) Nilai recall pada peringkat N
c) Jumlah dokumen relevan pada peringkat N
d) Jumlah query pada peringkat N

Jawaban: a) Nilai presisi pada peringkat N