WWW :: PDASCRAPER

WWW :: PDASCRAPER is een PERL-klasse voor het schrapen van PDA-vriendelijke inhoud van websites.
Download nu

WWW :: PDASCRAPER Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Perl Artistic License
  • Prijs:
  • FREE
  • Naam uitgever:
  • John Horner
  • Uitgever website:
  • http://search.cpan.org/~codyp/WWW-PDAScraper-0.1/PDAScraper.pm

WWW :: PDASCRAPER Tags


WWW :: PDASCRAPER Beschrijving

WWW :: PDASCRAPER is een PERL-klasse voor het schrapen van PDA-vriendelijke inhoud van websites. Www :: PDASCRAPER is een PERL-klasse voor het schrapen van PDA-vriendelijke inhoud van websites.Synopsis Gebruik www :: PDASCRAPER; Mijn $ Scraper = www :: PDASCRAPER-> Nieuwe QW (Newscientist Yahoo :: amusement); $ Scraper-> Schrap (); of gebruik www :: PDASCRAPER; Mijn $ Scraper = www :: PDASCRAPER-> NIEUW; $ Scraper-> Schrap QW (Newscientist Yahoo :: amusement); of PERL-MWWW :: PDASCRAPER -E -E "Schrap QW (NewsCientist Yahoo :: amusement)" Diverse Knudgey-scripts hebben geschreven om PDA-vriendelijke inhoud te downloaden van verschillende websites, i Besloten om een gegeneraliseerde oplossing te proberen en het gedeelte van een nieuwspagina uit te volgen die de koppelingen bevat die we willen * Munge die links naar de URL voor de printvriendelijke versie, indien mogelijk * Download die pagina's en maak een indexpagina Voor het verplaatsen van de pagina's naar uw PDA maakt geen deel uit van het bereik van de module: de open-source browser en "distilleerder", plucker, van http://pl.org/ wordt aanbevolen. Krijg het gewoon om het index.html-bestand te lezen met een diepte van 1 van schijf, met behulp van een URL LIKE FILE: ///PATHE/TO/Indx.htmlDe Sub-moduleswww :: PDASCRAPER gebruikt een reeks regels voor het schrapen van een bepaalde website Vanuit een tweede module, dwz www :: PDASCRAPER :: YAHOO :: amusement :: TV bevat de regels voor het schrapen van de Yahoo TV-nieuws Website: Pakket www :: PDASCRAPER :: YAHOO :: amusement :: TV; # Www :: PDASCRAPER.PM Regels voor het schrapen van de # Yahoo TV-website subconfiguratie {return {name => 'yahoo tv', start_from => 'http://news.yahoo.com/i/763', chunk_spec => , URL_REGEX => }; } 1; een min of meer willekeurige selectie van modules is inbegrepen, evenals een volledige set voor Yahoo, om een logische set modules in categorieën te demonstreren. Een nieuwe submodule moet relatief eenvoudig zijn, zie de meegeleverde sjabloon, Www :: PDASCRAPER :: Template.pm - U hebt naam, start_from, vervolgens Chunk_SPEC of URL_SPEC nodig, en vervolgens optioneel een URL_REGEX voor transformatie in de printvriendelijke URL.THEN verplaatst u uw nieuwe module naar dezelfde locatie als de andere Uw systeem, of zorg ervoor dat ze beschikbaar zijn voor uw script met een lijn zoals gebruik lib '/ pad / naar / lokale / modules / pdascraper /' vereisten: · Perl


WWW :: PDASCRAPER Gerelateerde software