Perbandingan Metode Web Scraping Menggunakan CSS Selector dan Xpath Selector
Pemanfaatan data atau berita yang tersebar di internet untuk meningkatkan peluang keberhasilan dalam sebuah usaha melalui analisa trend pasar adalah hal yang sangat umum pada saat ini. Penjelajahan Web (Crawl) dan ekstraksi data dari web (Scraping) menjadi salah satu hal yang penting, agar tidak ter...
Saved in:
Published in | Teknika (Institut Informatika Indonesia) (Online) Vol. 6; no. 1; pp. 43 - 46 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | English |
Published |
Center for Research and Community Service, Institut Informatika Indonesia Surabaya
30.11.2017
|
Subjects | |
Online Access | Get full text |
Cover
Loading…
Summary: | Pemanfaatan data atau berita yang tersebar di internet untuk meningkatkan peluang keberhasilan dalam sebuah usaha melalui analisa trend pasar adalah hal yang sangat umum pada saat ini. Penjelajahan Web (Crawl) dan ekstraksi data dari web (Scraping) menjadi salah satu hal yang penting, agar tidak terjadi data yang kurang sempurna, dan data yang diterima adalah data yang paling baru. CSS Selector dan Xpath merupakan salah satu metode yang umum digunakan dalam melakukan proses crawling. Terdapat perbedaan dari jumlah data yang terambil, besar file output dan waktu pemrosesan dari kedua metode tersebut, dimana Xpath memiliki keunggulan pada jumlah data yang terambil dan waktu pemrosesnya yang berakibat pada ukuran file output yang lebih besar. Sedangkan untuk penggunaan memori pada kedua metode pada proses crawling tidak memiliki perbedaan yang signifikan. |
---|---|
ISSN: | 2549-8037 2549-8045 |
DOI: | 10.34148/teknika.v6i1.56 |