| Krassen Een raamwerk voor het kruipen en schrapen van multi-pagina-websites |
Download nu |
Krassen Rangschikking & Samenvatting
- Naam uitgever:
- Peter Jones
- Uitgever website:
- http://rubyforge.org/users/pjones/
- Besturingssystemen:
- Mac OS X
Krassen Tags
Krassen Beschrijving
Een raamwerk voor het kruipen en schrapen van multi-paginale websites In tegenstelling tot andere schraapkaders, is het kader van het schraapsel ontworpen om met "vuile" websites te kunnen werken. Dat wil zeggen, websites die niet zijn ontworpen om hun gegevens die programmatisch worden geëxtraheerd .Scrapes omvatten functies voor zowel de initiële ontwikkeling van een schraper en het voortdurende onderhoud van die schraper.note: Scraper is ontwikkeld en onder de voorwaarden van het MIT / X Consortium-licentie. Hier zijn enkele belangrijke kenmerken van "schrampen": · Regelgebaseerde selectie en extractie van gegevens die CSS-selectoren of pseudo-xpath-uitdrukkingen kunnen gebruiken · Caching-systeem, zodat tijdens de ontwikkeling u niet continu pagina's van een webserver hoeft te downloaden, terwijl u experimenteert met uw selectoren en afzuigers · Validatiesysteem dat helpt bij het detecteren van websiteschepen die anders uw extractieregels zouden ongeldig verklaren · Ondersteuning voor het initiëren van een sessie met de webserver en passagesessiecookies terug naar de webserver · Wanneer al het andere faalt, kunt u een webpagina uitvoeren via de XSLTPROC XSLT-processor om een XML-document te genereren dat vervolgens door uw regel gebaseerde parser kan worden uitgevoerd · Handige set na-verwerkingsmethoden zoals Normalize_Name Wat is er nieuw in deze release: · Eerste openbare release.
Krassen Gerelateerde software