476 - Seminar Nasional Aplikasi Teknologi Informasi 2008...

Info iconThis preview shows pages 1–2. Sign up to view the full content.

View Full Document Right Arrow Icon
Seminar Nasional Aplikasi Teknologi Informasi 2008 (SNATI 2008) ISSN: 1907-5022 Yogyakarta, 21 Juni 2008 C -27 HIERARCHICAL CLUSTERING UNTUK APLIKASI AUTOMATED TEXT INTEGRATION Gregorius S. Budhi 1 ; Arlinah I. Rahardjo 2 ; Hendrawan Taufik 3 Universitas Kristen Petra Jurusan Teknik Informatika Jalan Siwalankerto 121-131 Surabaya 60236, Jawa Timur, Indonesia E-mail: greg@petra.ac.id , arlinah@petra.ac.id ABSTRAK Membaca beberapa dokumen yang membahas topik yang sama memerlukan waktu yang lama. Peneliti mencoba membuat aplikasi Automated Text Integration yang dapat menghasilkan integrasi dari beberapa dokumen yang berbeda dengan topik bahasan yang sama. Aplikasi ini memberi kemudahan kepada pembaca dalam menggali informasi pada dokumen – dokumen tersebut. Teknik Data Mining Hierarchical Clustering digunakan untuk mengintegrasikan dokumen – dokumen yang berbeda itu. Metode perhitungan bobot kalimat, yang dimodifikasi dari penelitian sebelumnya [5], berfungsi untuk menghitung nilai bobot dari setiap kalimat. Nilai bobot ini digunakan sebagai dasar penggabungan cluster. Terakhir Cosine Distance digunakan untuk menghitung similarity (tingkat kesamaan) antar dokumen – dokumen yang akan diintegrasi. Dari hasil survei terhadap 100 orang responden, sebanyak 78% responden mengatakan bahwa integrasi dokumen yang dihasilkan telah benar. Selain itu, hasil integrasi yang baik akan didapat bila jenis dokumen yang diintegrasi bertipe eksposisi. Keywords: Integrasi Dokumen, Hierarchical Clustering, Cosine Distance 1. PENDAHULUAN Salah satu cara untuk memperoleh informasi seimbang adalah dengan membaca beberapa dokumen yang membahas topik yang sama. Namun hal ini menyulitkan pembaca untuk menangkap topik bahasan utama dari dokumen - dokumen tersebut karena harus mengingat – ingat isi dokumen yang telah dibaca sebelumnya. Pembaca harus mengintegrasikan dahulu dokumen – dokumen yang dia baca didalam pikirannya sebelum dapat merangkum maksud dan topik utama dokumen – dokumen tersebut secara keseluruhan. Pada penelitian ini peneliti mencoba membuat aplikasi Automated Text Integration yang dapat menghasilkan integrasi dari beberapa dokumen elektronik yang berbeda dengan topik bahasan yang sama secara otomatis. Proses integrasi akan menghasilkan dokumen baru yang mengandung semua bagian dari dokumen – dokumen awal, namun memiliki susunan antar kalimat serta antar paragraf yang berbeda. Perbedaan ini karena saat proses integrasi topik – topik bahasan yang serupa ( similar ) dari semua dokumen dikumpulkan menjadi satu paragraf dan disusun ulang kalimat per kalimat sesuai dengan besarnya kesamaan ( similiarity ) antar kalimatnya. Dengan membaca hasil integrasi diharapkan pembaca dapat terbantu dalam menyerap informasi penting yang ada dalam kumpulan dokumen yang berbeda dan tidak perlu lagi membaca sekumpulan dokumen satu per satu.
Background image of page 1

Info iconThis preview has intentionally blurred sections. Sign up to view the full version.

View Full DocumentRight Arrow Icon
Image of page 2
This is the end of the preview. Sign up to access the rest of the document.

This note was uploaded on 10/04/2009 for the course BUDI LUHUR 15222 taught by Professor Publish during the Fall '06 term at Universitas Budi Luhur.

Page1 / 6

476 - Seminar Nasional Aplikasi Teknologi Informasi 2008...

This preview shows document pages 1 - 2. Sign up to view the full document.

View Full Document Right Arrow Icon
Ask a homework question - tutors are online