Swish-e

Open Source-project dat u helpt bij het indexeren van bestanden en webpagina's
Download nu

Swish-e Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • GPL
  • Prijs:
  • FREE
  • Naam uitgever:
  • The Swish-e Project
  • Uitgever website:
  • http://swish-e.org/
  • Besturingssystemen:
  • Mac OS X
  • Bestandsgrootte:
  • 1.4 MB

Swish-e Tags


Swish-e Beschrijving

Open source project dat u index bestanden en webpagina's zal helpen Swish-e is een snelle, flexibele en gratis open source systeem voor het indexeren van verzamelingen van webpagina's of andere bestanden. Swish-e is bij uitstek geschikt voor de collecties van een miljoen documenten of kleiner. Met behulp van de GNOME libxml2 parser en een verzameling van filters, Swish-e kan indexeren platte tekst, Microsoft Word / PowerPoint / Excel, e-mail, PDF, HTML, XML, en zowat elk bestand dat kan worden omgezet naar XML of HTML tekst . Swish-e wordt ook vaak gebruikt om aan te vullen databases zoals de MySQL DBMS voor zeer snelle full-text zoeken. Hier zijn een aantal belangrijke eigenschappen van "Swish-e": · Snel index een groot aantal documenten in verschillende formaten, waaronder tekst, HTML en XML. · Gebruik "filters" te indexeren andere typen bestanden, zoals PDF, gzip, of PostScript. · Inclusief een web spider voor het indexeren van externe documenten via HTTP. Volgt Robots Exclusion Rules (met inbegrip van META-tags). · Kan een extern programma gebruiken om documenten te Swish-e, leveren zoals een geavanceerde spin voor uw webserver of een programma te lezen en het formaat records uit een relationele database. · Document "eigenschappen" (sommige subset van het brondocument, meestal gedefinieerd als een META of XML-elementen) kunnen worden opgeslagen in de index en kwam terug met zoekresultaten. · Samenvattingen Document kan worden geretourneerd met elke zoekopdracht. · Word gevolg, soundex, metaphone, en dubbel-metaphone indexering voor "fuzzy" zoeken · Phrase zoeken en wildcard zoeken · Beperk zoekopdrachten HTML-links. · Gebruik krachtige reguliere expressies om documenten voor het indexeren of uitsluiting te selecteren. · Eenvoudig te beperken zoekopdrachten te delen of het geheel van uw website. · De resultaten kunnen worden gesorteerd op relevantie of door een aantal objecten in oplopende of aflopende volgorde. · Beperk zoekopdrachten om delen van documenten, zoals bepaalde HTML-tags (META, TITLE, opmerkingen, etc.) of aan XML-elementen. · Kan structurele fouten in uw XML- en HTML-documenten te melden. · Index bestand is draagbaar tussen platforms. · Een Swish-e bibliotheek wordt geboden, zodat het inbedden van Swish-e in uw toepassingen voor zeer snel zoeken. Een Perl module beschikbaar die een standaard API voor toegang Swish-e verschaft. · Inclusief bijvoorbeeld zoeken script met context samenvattingen en zoekterm en zin highlighting. Kan gebruikt worden met populaire Perl templating systemen. · Swish-e is snel. · Het is Open Source en GRATIS! U kunt Swish-e te passen en u kunt uw mooie nieuwe features aan het project bijdragen. · Ondersteund door on-line gebruikers en ontwikkelaars groepen. Wat is er nieuw in deze release: · Vaste 'leeglopen' hanteren in spider.pl · Opnieuw indexeren vereist · Vaste stemmer bug geïntroduceerd in 2.4.4 · Nu vork / exec om filters te draaien · Vaste ondertekend / unsigned waarschuwingen van gcc 4.x · Makefile.mingw opgenomen in distrib


Swish-e Gerelateerde software

Frethorcut

Firefox-add-on waarmee u functietoetsen kunt gebruiken om snelkoppelingen voor URL's te maken. ...

145 4 KB

Downloaden