Screen Scraping – Opis i Zastosowanie
Screen scraping, czyli 'zeskrobywanie z ekranu’, to technika, która pozwala programom komputerowym na wydobywanie danych z interfejsów innych programów, najczęściej przeznaczonych dla ludzi. Narzędzie do tego procesu nazywa się screen scraper. W przeciwieństwie do parsowania, screen scraping zajmuje się danymi sformatowanymi dla człowieka, co czyni go unikalnym.
Synonimy
Screen scraping jest znany również pod różnymi nazwami, takimi jak:
- data scraping
- data extraction
- web scraping
- page scraping
- HTML scraping
Transfer Danych
Transfer danych między programami zazwyczaj odbywa się za pośrednictwem struktur zrozumiałych dla maszyn, co ogranicza dwuznaczność i duplikację. Z kolei dane przeznaczone dla ludzi często zawierają nadmiarowe informacje, które mogą skomplikować proces interpretacji. W sytuacjach, gdy dane są dostępne jedynie w formacie przyjaznym człowiekowi, screen scraping staje się jedyną opcją transferu danych.
Historia i Technologia
Pierwotnie screen scraping odnosił się do odczytu danych z ekranu terminala komputerowego. Dziś technika ta jest stosowana w kontekście przetwarzania HTML na stronach internetowych. Programy do screen scrapingu muszą być odpowiednio zaprogramowane, aby wydobywać istotne dane, jednocześnie ignorując zbędne informacje.
Wyzwania i Krytyka
Screen scraping postrzegany jest jako technika mniej elegancka i stosowana w sytuacjach awaryjnych. Oprócz większego wysiłku programistycznego, zmiany w strukturze danych przeznaczonych dla ludzi mogą prowadzić do błędów w przetwarzaniu przez programy komputerowe. W efekcie, mogą one zwracać nieprawidłowe wyniki.
Linki zewnętrzne
- Screen-scraping with WWW::Mechanize – artykuł o scrapingu za pomocą Perla
- Agregacja danych. Miej ryzyko pod kontrolą – artykuł o prawnych aspektach m.in. screen scrapingu
Kategoria: Programowanie komputerów