| Rdig FERRET GEBASEERDE CRAWLER EN CONTENTACTOR VOOR HET BOUWEN VAN EEN Volledige tekstindex van de inhoud van een website |
Download nu |
Rdig Rangschikking & Samenvatting
- Naam uitgever:
- Jens Kramer
- Uitgever website:
- http://rubyforge.org/projects/stellr/
- Besturingssystemen:
- Mac OS X
Rdig Tags
Rdig Beschrijving
FERRET GEBASEERDE CRAWLER EN INHOUD EXTRACTOR Voor het bouwen van een volledige tekstindex van de inhoud van een website RDIG biedt een inhoudsextractie en een HTTP CRAWLER-hulpprogramma's om een site te bouwen zoeken naar websites of intranetten. Intern wordt Ferret gebruikt voor de volledige tekstindexering. Na het maken van een config-bestand voor uw site, kan de index worden gebouwd met een enkele oproep naar RDIG.Note: RDIG is ontwikkeld en licentie onder de voorwaarden van de MIT / X Consortium-licentie. Vereisten: · Ferret 0.1 of later · HPRICOT 0.4 OF LATER Wat is er nieuw in deze release: · Voeg MAX_DEPTH-optie toe aan de configuratie van de rupstoffen voor het beperken van de crawl naar een specifieke diepte · Ondersteuning toevoegen voor HTTP-proxies, inclusief basisverificatie · Verwijder rubyful_soup-ondersteuning
Rdig Gerelateerde software