lwp-rget

LWP-RCK is een PERL-module die wordt gebruikt om webdocumenten recursief op te halen.
Download nu

lwp-rget Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Perl Artistic License
  • Prijs:
  • FREE
  • Naam uitgever:
  • Gisle Aas
  • Uitgever website:
  • http://search.cpan.org/~gaas/

lwp-rget Tags


lwp-rget Beschrijving

LWP-RCK is een PERL-module die wordt gebruikt om webdocumenten recursief op te halen. LWP-RCK is een PERL-module die wordt gebruikt om webdocumenten recursivelively op te halen.Synopsis LWP-RGET ] LWP-RGET - Persionthis programma haalt een document op en bewaar deze in een lokaal bestand. Het volgt eventuele links die in het document worden aangetroffen en deze documenten ook opslaan, koppelingen opslaan, zodat ze verwijzen naar deze lokale exemplaren. Dit proces gaat door totdat er geen niet-beoogde links is of het proces wordt gestopt door de ene of meer van de limieten die kunnen worden bestuurd door de opdrachtregelargumenten. Dit programma is handig als u een lokale kopie van een verzameling documenten wilt maken Of wilt Web-lezen off-line gebruiken. Alle documenten worden opgeslagen als gewone bestanden in de huidige map. De gekozen bestandsnamen zijn afgeleid van de laatste component van URL PATHS.De opties zijn: - Auth = Gebruiker: Pasnset De authenticatiegegevens aan de gebruiker "Gebruiker" en wachtwoord "Pass" als er beperkte delen van de website worden geraakt. Als er beperkte delen van de website van de website en authenticatie-referenties niet beschikbaar zijn, worden die pagina's niet gedownload .-- Diepte = NLIMIT Het recursieve niveau. Embedded-afbeeldingen zijn altijd geladen, zelfs als ze buiten de - decth vallen. Dit betekent dat men --Depth = 0 kan gebruiken om een enkel document samen met alle inline-graphics te halen. De standaarddiepte is 5 .-- Hierouchy-bestanden in een hiėrarchie die de website van de website bootst. De standaardinstelling is om alle bestanden in de huidige map te plaatsen .-- Referentier = URSET De waarde van de referentiekop voor het eerste verzoek. De speciale waarde "NONE" kan worden gebruikt om de referentiekop in een van de volgende verzoeken te onderdrukken. De kop van de refersier wordt altijd onderdrukt in alle normale HTTP-aanvragen als de verwijzende pagina via HTTPS is verzonden zoals aanbevolen in RFC 2616 .-- Iissends een "Accepteren: * / *" op alle URL-aanvragen als een oplossing voor een bug in IIS 2.0 . Als er geen Accept-MIME-header aanwezig is, retourneert IIS 2.0 met een "406 Geen aanvaardbare objecten gevonden" Fout. Converteert ook een back-schuine strepen (\) in URL's om Slashes (/).-keepext=mime/typestes de huidige extensie voor de lijst MIME-typen te doorsturen. Handig bij het downloaden van tekst / duidelijke documenten die niet allemaal moeten worden vertaald naar * .txt-bestanden .-- limiet = NLIMIT het aantal documenten om te krijgen. De standaardlimiet is 50.-- NospaceChanges-ruimtes in alle URL's om tekens (_) te onderstrepen. Handig bij het downloaden van bestanden van sites die URL's serveren met spaties erin. Verwijdert geen spaties uit fragmenten, b.v., "bestand.html # ergens hier" .-- Prefix = URL_PREFIXLIMIT De links om te volgen. Alleen URL's die de Prefix-reeks starten, worden gevolgd. Het standaardvoorvoegsel wordt ingesteld als de "Directory" van de eerste URL om te volgen. Als we bijvoorbeeld LWP-RCET beginnen met de URL http://www.sn.no/foo/bar.html, wordt voorvoegsel ingesteld op http://www.sn.no/foo/.gebruik - prefix = '' Als u niet wilt dat het fetching wordt beperkt door een voorvoegsel .-- SLEEP = NSLEEP N seconden voordat u elk document opneemt. Met deze opties kunt u langzaam gaan, waarbij u de server die u te veel bezoekt niet laden .-- TolowerTranslates Alle links naar kleine letters. Handig bij het downloaden van bestanden van IIS, omdat het geen bestanden dient in een hoofdlettergevoelige manier .-- VerboSemake meer geluid tijdens het hardlopen .-- Quietdon't geen geluid .-- Versieprintprogramma-versienummer en stoppen .-- Helpprint Het gebruiksbericht en stoppen. Voordat het programma de naam van het bestand verlaat, waar de eerste URL wordt opgeslagen, wordt afgedrukt op stDout. Alle gebruikte bestandsnamen worden ook op Stderr afgedrukt zoals ze zijn geladen. Deze afdrukken kan worden onderdrukt met de optie --Het. Vereisten: · Perl


lwp-rget Gerelateerde software