Www :: Schraper :: Lite

Een raamwerk voor het schrapen van resultaten van zoekmachines
Download nu

Www :: Schraper :: Lite Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • GPL v3
  • Naam uitgever:
  • Roger Pettett
  • Uitgever website:
  • http://search.cpan.org/~rpettett/

Www :: Schraper :: Lite Tags


Www :: Schraper :: Lite Beschrijving

Een raamwerk voor het schrapen van resultaten van zoekmachines Www :: Scraper :: Lite is een HTTP-schrapermodule geschreven in Perl.Synopsis My $ Domain = 'http: //devsite.local/'; Mijn $ Scraper = www :: Schraper :: Lite-> Nieuw (); $ Scraper-> Crawl ($ domein, {'// a' => sub {# handler voor alle 'A' tags mijn ($ schraper, $ knooppunten) = @_; $ Scraper-> Enquumue (grep {$ _ = ~ m {^ $ domein}} # alleen deze domeinkaart {$ Scraper-> URL_Remove_anchor ($ _)} # Alleen indexpagina's zonder #anchor kaart {$ Scraper-> URL_MAKE_ABSOLUTE ($ _)} # Indexer heeft absolute URLS-kaart nodig $ _-> {href}} # Trek Href uit de 'A' DOM-knooppunt @ {$ knooppunten});}, '/ *' => sub {# handler voor alle inhoud My ($ Scraper, $ NODEN) = @_; Print $ Scraper -> {actueel} -> {reactie} -> Inhoud; # Doe iets bruikbaar met HTTP-reactie},}); Vereisten: · Perl · streng · WAARSCHUWINGEN · LWP :: Useragent · HTML :: TreeBuilder :: XPath


Www :: Schraper :: Lite Gerelateerde software