Arfian Hidayat


Salurkan Ilmu Dengan Menulis

Algoritma Winnowing

Winnowing adalah algoritma yang digunakan untuk melakukan proses pengecekkan kesamaan kata (document fingerprinting) untuk mengidentifikasi plagiatisme (penjiplakan).  Algoritma yang digunakan untuk mencari nilai hash dalam winnowing adalah rolling hash. Nilai hash merupakan nilai numerik yang terbentuk dari perhitungan ASCII tiap karakter.

  1.     Penghapusan karakter-karakter yang tidak relevan (whitespace insensitivity), antara lain spasi atau tanda baca.
  2.     Pembentukan rangkaian gram dengan ukuran k.
  3.     Penghitungan nilai hash dari setiap gram.
  4.     Membagi ke dalam window tertentu.
  5.     Pemilihan beberapa nilai hash menjadi document fingerprinting.
  6.     Menentukan prosentase kesamaan antara 2 dokumen dengan persamaan Jaccard Coefficient

Contoh Program dapat dilihat disini

Posting Oleh Admin, 14 April 2016, 19:14


algoritma, ascii, fingerprint, hash, jaccard coefficient, rolling hash, whitespace insensitivity, winnowing, winnowing algorithm