Dalam
bidang penelitian information retrieval (sistem
temu kembali) terdapat salah satu metode perangkingan sederhana namun
memberikan hasil yang sudah mencukupi untuk sebuah sistem pencarian terhadap
dokumen. Metode tersebut kita kenal dengan nama Vector
Space Model (VSM). Pada prinsipnya metode perangkingan
pencarian dokumen ini didasarkan pada perhitungan jarak kemiripan dengan
cosinus antara vektor
dokumen dengan vektor query.
Ketika
sebuah dokumen dimasukkan dalam suatu ruang vektor, maka kita dapat
membayangkan sebuah ruang vektor yang memiliki dimensi luar biasa besar dan
ditentukan oleh banyaknya term/kata yang terbentuk saat proses pengindeksan dokumen.
Pengindeksan terhadap kumpulan dokumen yang dapat dicari merupakan sebuah
proses tersendiri. Konsep umum yang diterapkan untuk pembuatan struktur indeks
adalah menggunakan model inverted index.
Dalam inverted index, kita mengenal ada sebuah daftar kamus (dictionary) yang berisi kata atau term hasil dari pemrosesan setiap dokumen. Dari
setiap kata yang ada dalam dictionary, lalu
terbentuk sebuah linked list yang berisi urutan dokumen yang mengandung term tersebut. (Lihat gambaran struktur tersebut
dari Christopher D. Manning.)
Link Download Project :
Keyword :
Vector Space Model
Contoh Kasus
Penyelesaian Kasus VSM
Rumus Penyelesaian
No comments:
Post a Comment