Terriër

Terrier - Zeer flexibel, efficiënt en robuuste zoekmachine, gemakkelijk inzetbaar op grootschalige collecties van documenten
Download nu

Terriër Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Freeware
  • Prijs:
  • FREE
  • Naam uitgever:
  • University of Glasgow
  • Uitgever website:
  • http://ir.dcs.gla.ac.uk/terrier/index.html
  • Besturingssystemen:
  • Mac OS X
  • Bestandsgrootte:
  • 5.8 MB

Terriër Tags


Terriër Beschrijving

Terrier - Zeer flexibel, efficiënt en robuuste zoekmachine, gemakkelijk inzetbaar op grootschalige collecties van documenten Terrier is een zeer flexibel, efficiënte, effectieve en robuuste zoekmachine, die gemakkelijk inzetbaar is op grootschalige collecties van documenten. Terrier implementeert state-of-the-art indexing- en ophaalfunctionaliteiten. Terrier biedt een ideaal platform voor de snelle ontwikkeling van grootschalige retrieval-applicaties. De open source-versie van Terrier biedt een flexibel, uitgebreid, transparant en robuust platform voor onderzoek en experimenten in het ophalen van de tekst. Het onderzoek naar het terriër wordt voortdurend uitgezonden Takken van het veld van de breder informatie, het maken van terriër, een ideaal, sterk, modulair en state-of-the-art platform voor het ontwikkelen, beoordelen en evalueren van nieuwe concepten en ideeën. Brandrier is geschreven in Java en werd gebruikt voor Web en Enterprise Search, Desktop, Intranet en Verticale zoekmachines, evenals het ontwikkelen en evalueren van nieuwe grootschalige tekstinformatie-retrieval-technieken en -toepassingen.TERRIER wordt ontwikkeld in de afdeling Computing Science, aan de Universiteit van Glasgow. Er zijn enkele belangrijke functies van "Terrier": algemeen: · Indexeringsondersteuning voor gemeenschappelijke desktopbestandsindelingen, en voor algemeen gebruikte TREC-onderzoekscollecties (bijv. TREC CD's 1-5, WT2G, WT10G, GOV, GOV2, BLOGS06). · Veel modellen voor documentgewicht, zoals veel parametervrije divergentie van willekeurige wegingmodellen, Okapi BM25 en taalmodellering. · Conventionele querytaal ondersteund, inclusief zinnen en termen die voorkomen in tags. · Handeloos Full-Text-indexering van grootschalige documentcollecties, in een gecentraliseerde architectuur tot ten minste 25 miljoen documenten. · Modulaire en open indexering en querying-API's, om eenvoudige uitbreiding voor uw eigen toepassingen en onderzoek mogelijk te maken. · Actief informatieverhogingsonderzoek naar de Open Source Platform. · Open source (Mozilla Public License). · Geschreven in cross-platform Java - Werkt op Windows, Mac OS X, Linux en Unix. · Grote gebruikersbasis van meer dan 3 jaar openbare release. van-de doos indexering van getagde documentcollecties, zoals de TREC-testcollecties. · Out-of-the box-indexering voor documenten van verschillende indelingen, zoals HTML-, PDF- of Microsoft Word, Excel- en PowerPoint-bestanden. · Indexering van het veld informatie, dergelijke Als titel, H1, HTML-tags-informatie · Indexering van positie-informatie over een woord, of een blok (b.v. een venster van termen binnen een afstand) niveau. · Ondersteuning voor verschillende coderingen van documenten (UTF), om multi-lingual retrieval te vergemakkelijken. · Zeer gecomprimeerde indexschijfgegevensstructuren. · Zeer gecomprimeerd direct bestand voor efficiënte query-expansie. · Alternatief snellere single -Pass-indexering. · Verschillende stammingtechnieken, inclusief de sneeuwbal Stemmen voor Europese talen.Retrieval: · biedt standaardquerierfaciliteiten, evenals query-uitbreiding (pseudo-relevantie-feedback) · kan worden toegepast in interactieve toepassingen, zoals de meegeleverde desktop Zoeken, of in een batch-instelling voor onderzoek en experimenteren. · Biedt vele standaarddocumentgewichtingsmodellen, waaronder tot 126 divergentie van WILLANDNESS (DFR) Document Ranking-modellen en andere modellen zoals Okapi BM25, taalmodellering en TF-IDF. Het nieuwe DFRE DFR-weegmodel is ook opgenomen, wat robuuste prestaties levert op een reeks testcollecties zonder de noodzaak van een paramterafstemming of opleiding. · Geavanceerde querytaal die Boolean-operators, +/- operators, uitdrukking en nabijheidszoekopdracht ondersteunt, en Velden. · Biedt een aantal parametervrije DFR-term weight-modellen voor automatische query-expansie, naast de query-uitbreiding van Rocchio. · Flexibele verwerking van termen via een pijplijn van componenten, zoals stop-woorden verwijderaars en stemmers.Experimentatie: · Handvatten Alle momenteel verkrijgbare TREC-testcollecties - zie voorbeelden van TREC-experimenten voor voorbeelden en bekende instellingen. · Eenvoudig geschriftbaar om vele parameterinstellingen te evalueren, of vele wegingsmodellen in batchformulier. · Ingebouwde evaluatietools voor gebruik met TREC-ad-hoc en bekend Item Zoekopdracht Resultaten, om verschillende precisie- en herinneringsmaatregelen te produceren.note: Terrier wordt vrijgegeven onder de Mozilla Public License.


Terriër Gerelateerde software

Hessianobjc

HESSANOBJC - MAC OS X Native Framework dat het Hessische Binary Web Service-protocol in objectief-C implementeert ...

156 181 KB

Downloaden