ANALISIS KECENDERUNGAN INFORMASI MENGGUNAKAN ALGORITMA HIERARCHICAL AGGLOMERATIVE CLUSTERING

Herny Februariyanti, Jati Sasongko Wibowo, Dwi Budi Santoso, Muji Sukur

Abstract


Media Sosial merupakan media online dimana dengan mudah para penggunanya dapat ikut berpartisipasi, saling berbagi (sharing) dan juga dapat memmbuat konten atau menciptakan isi. Media online ini contohnya adalah jejaring social, twitter, wiki, forum serta dunia virtual. Twitter merupakan salah satu media social yang seringkali dan paling umum digunakan orang disegala penjuru dunia. Tujuan dari penelitian ini adalah melakukan proses klastering dengan menggunakan algoritma Hierarchical Agglomerative Clustering yang diimplementasikan pada dokumen teks di twitter di akun twitter @unisbank. Data penelitian ini merupakan data tweet (kicauan) yang berisi isue yang menjadi bahan kicauan mahasiswa yang dikumpulkan berdasarkan hashtag tentang Unisbank Semarang. Untuk mengetahui keterkaitan informasi yang satu dengan lainnya digunakan algoritma Eucledian Distance untuk perhitungan jarak dokumen. Hasil perhitungan jarak dokumen dihasilkan jarak terdekat sebesar 1 dan jarak terjauh sebesar 69. Hasil penelitian ini menyajikan klastering data teks twitter dengan Algoritma Hierarchical Agglomeratif dengan mengambil titik tengah 20 menghasilkan klaster sejumlah 7 buah klaster dengan klaster paling besar adalah dengan jarak eucledian sebesar 28.


Full Text:

PDF

References


Andika, Ari. (2015). Perancangan Aplikasi Pengukuran Similaritas Pada Dokumen Dengan Metode Semantic. STMIK Budi Darma: Medan

Coletta LFS, D.S., (2014). Combining classification and clustering for tweet sentimen analysis. Proceedings-2014 Brazilian conference on intelligent System (pp 210-115). Brazil: BRACIS. Doi:https://doi.org.10.1371/journal.pone.0079449

Ellis, D., (1996). Progress and Problems in Information Retrieval, 2nd ed. London: Library Association.

Februariyanti H., Zuliarso E., Utomo M.S., (2010) DINAMIK UNISBANK Semarang / Volume XV / Nomor 2 / Juli 2010 / ISSN : 0854 - 9524 / Hal.115-120, tersedia : https://eprints.unisbank.ac.id/id/eprint/1579

Kuncoro, Mudrajad. (2009). Mahir Menulis: Kiat Jitu Menulis Artikel Opini, Kolom, dan Resensi Buku. Jakarta: Erlangga.

Nugroho, E. (2011). Perancangan Sistem Deteksi Plagiarisme Dokumen Teks Dengan Menggunakan Algoritma Rabin-Karp. Repository-Uin, (Online), tersedia: http://repository.uinsuska.ac.id/3863/8/em.pdf.

Salton, G., (1971). Cluster Search Strategies and the Optimization of Retrieval Efectiveness, dalam G. Salton, ed. The SMART Retrieval System: Experiments in Automatic Document Processing. Englewood Cliffs: Prentice-Hall, 223-242

Salton, G., (1989). Automatic Text Processing, The Transformation, Analysis, and Retrieval of Information by Computer, Addison – Wesly Publishing Company, Inc. All rights reserved.

Tan, Ah-Hwee, (1999). Text Mining: The state of the art and the challenges, Kent Ridge Digital Labs 21 Heng Mui Keng Terrace Singapore 119613

Zhang J., Jianfeng G., Ming Z., Jiaxing W., (2001). Improving the Effectiveness of Information Retrieval with Clustering and Fusion, Computational Linguistics and Chinese Language Processing, Vol. 6, No. 1, February 2001, pp. 109-125.

Zuliarso, E., & Mustofa, K. (2009). Crawling Web berdasarkan Ontology. Dinamik, Vol.14 No.2. https://www.unisbank.ac.id/ojs/index.php/fti1/article/view/97




DOI: http://dx.doi.org/10.36723/juri.v13i1.247

Refbacks

  • There are currently no refbacks.


Lisensi Creative Commons
Ciptaan disebarluaskan di bawah Lisensi Creative Commons Atribusi-NonKomersial 4.0 Internasional.