ALGORITMA UNTUK EKSTRAKSI TABEL HTML DI WEB

Purnamasari, Detty and Wicaksana, I Wayan Simri and Ruhama, Syamsi ALGORITMA UNTUK EKSTRAKSI TABEL HTML DI WEB. Konferensi Nasional Sistem Informasi 2012, STMIK - STIKOM Bali 23-25 Pebruari 2012 (128).

[img]
Preview
Text
128.pdf - Submitted Version

Download (597Kb) | Preview

Abstract

Data di web dapat tersedia dalam format data terstruktur, semi struktur dan tidak terstruktur . Salah satu bentuk data terstruktur yang kerap disajikan pada halaman web adalah dalam bentuk tabel berbasis HTML. Pada keperluan bisnis kerap kali perlu untuk mengambil data dari berbagai sumber untuk digabungkan atau diproses lebih lanjut. Permasalahan yang timbul adalah bagaimana mengambil data dari tabel tersebut secara otomatis untuk kemudian dapat dilakukan proses lebih lanjut, seperti mengambil bagian yang dianggap penting, dan menggabungkan tabel dari halaman web yang lain. Penelitian yang dilakukan adalah mengembangkan algoritma untuk ekstraksi tiga bentuk tabel, yaitu tabel bentuk standar, tabel bentuk penggabungan baris (join row), dan tabel bentuk penggabungan cell/kolom (join coloum) dan memberikan ilustrasi dari algoritma yang dikembangkan.

Item Type: Article
Uncontrolled Keywords: ekstraksi tabel; join column; join row; website
Subjects: A General Works > AI Indexes (General)
Divisions: Fakultas Ilmu Komputer dan Teknologi Informasi > Program Studi Sistem Informasi
Depositing User: Mr Reza Chandra
Date Deposited: 27 Feb 2014 02:51
Last Modified: 27 Feb 2014 02:51
URI: http://repository.gunadarma.ac.id/id/eprint/102

Actions (login required)

View Item View Item