Pengembangan Aplikasi Wrapper Untuk Ekstraksi Data Pada Halaman Web Dengan Menggunakan Python

Banowosari, Lintang Y. and Pamungkas, Didik and Wicaksana, I Wayan S. and Mutiara, A.Benny Pengembangan Aplikasi Wrapper Untuk Ekstraksi Data Pada Halaman Web Dengan Menggunakan Python. Skripsi Program Studi Sistem Informasi. (Submitted)

[img]
Preview
Text
Pengembangan Aplikasi Wrapper Untuk Ekstraksi Data Pada Halaman Web Dengan Menggunakan Python_UG.pdf - Submitted Version

Download (239Kb) | Preview

Abstract

Web yang tidak terstruktur saat ini berisi berjuta-juta dokumen yang sulit di query dan struktur yang bercampur. Data terstruktur menjadi suatu hal yang diperlukan dalam suatu sistem informasi yang saling terhubung. Dengan Semantic Web, semua informasi yang tersedia pada suatu web akan menjadi lebih terstruktur dan berkualitas. Metode yang dapat digunakan untuk dapat mengekstrak data dari halaman web dan mengubahnya menjadi data yang lebih terstruktur adalah dengan menggunakan suatu modul yang disebut wrapper. Pada awalnya proses wrapping menggunakan metode manual. Yaitu dengan beberapa tahapan, yang pertama menerima halaman web, kemudian yang kedua melakukan proses parsing dari halaman web tersebut (format HTML). Proses parsing ini tidak akan mengeluarkan semua tag HTML, tapi memilih hanya pada struktur dokumen, format logical, dan format fisik. Dan yang ketiga adalah menempatkan informasi yang telah diperoleh ke dalam bentuk yang lebih terstruktur, misalnya dalam format XML. Permasalahan yang timbul adalah terkadang menyulitkan untuk memahami isi dari masing-masing halaman web tersebut serta sangat membutuhkan tenaga kerja yang banyak. Untuk mengatasi kesulitan tersebut penulis mengembangkan suatu aplikasi wrapper yang digunakan untuk mengekstrak data yang semi-terstruktur menjadi data yang terstruktur. Yang akan memudahkan dalam menentukan class dan properties dari suatu data pada halaman web, sehingga nantinya akan memudahkan dalam memahami isi dari suatu halaman web. Aplikasi ini dibuat dengan menggunakan bahasa pemrograman Python 2.5.

Item Type: Article
Uncontrolled Keywords: Semantic Web; Wrapper; Class; Properties; Python
Subjects: A General Works > AI Indexes (General)
Divisions: Fakultas Ilmu Komputer dan Teknologi Informasi > Program Studi Sistem Informasi
Depositing User: Mr Reza Chandra
Date Deposited: 25 Feb 2014 04:10
Last Modified: 25 Feb 2014 04:10
URI: http://repository.gunadarma.ac.id/id/eprint/45

Actions (login required)

View Item View Item