Web :: Schraper

Webschrapkit met behulp van HTML- en CSS-selectors of XPath-uitdrukkingen
Download nu

Web :: Schraper Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Perl Artistic License
  • Prijs:
  • FREE
  • Naam uitgever:
  • Tatsuhiko Miyagawa
  • Uitgever website:
  • http://search.cpan.org/~miyagawa/

Web :: Schraper Tags


Web :: Schraper Beschrijving

Webschrapking Toolkit met behulp van HTML- en CSS-selectors of XPath-uitdrukkingen Web :: Schraper is een Web Scraper Toolkit, geïnspireerd op Ruby's equivalente scrapi. Het biedt een DSL-ISH-interface voor het doorlopen van HTML-documenten en het retourneren van een netjes ingerichte perl-gegevensstruture. De schraper- en procesblokken bieden een methode om te definiëren welke segmenten van een document om te extraheren. Het begrijpt CSS- en HTML-selectors en XPath-uitdrukkingen. Synopsis Gebruik URI; Gebruik Web :: Schraper; # Ten eerste, maak je schraperblok mijn $ tweets = schraper {# parseer alle Lis met de klasse "Status", sla ze op in een resulterende # array 'tweets'. We maken voor elke tweet een andere schraper in. Proces "li.status", "Tweets []" => Scraper {# en, in die array, trek in de element in met de klasse # "Entry-content", "Invoerdatum" en het koppelingsproces ". inhoud ", lichaam => 'tekst'; Proces ".Entry-datum", wanneer => 'tekst'; Proces 'A , link =>' @href '; }; }; Mijn $ Res = $ Tweets-> Schrap (uri-> Nieuw ("http://twitter.com/miyagawa")); # Het resultaat heeft de bevolkte tweetsarray voor mijn $ Tweet (@ {$ res -> {tweets}}) {print "$ Tweet -> {body} $ Tweet -> {wanneer} (link: $ Tweet -> {link })\N"; } Vereisten: · Perl


Web :: Schraper Gerelateerde software

DX_Central

Een bureaublad grafisch weergave van ongelijksoortige bronnen in een eenvoudig te gebruiken formaat ...

126

Downloaden