Het Lemur-project

Taalmodellering en informatietoepassing
Download nu

Het Lemur-project Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Freeware
  • Prijs:
  • FREE
  • Naam uitgever:
  • The Lemur Team
  • Uitgever website:
  • http://www.lemurproject.org/
  • Besturingssystemen:
  • Mac OS X
  • Bestandsgrootte:
  • 63.6 MB

Het Lemur-project Tags


Het Lemur-project Beschrijving

Taal modelleren en information retrieval applicatie De Maki Toolkit is een gratis en open source applicatie die ontworpen is om het onderzoek in de taal van het modelleren en het ophalen van informatie te vergemakkelijken. De Maki Toolkit omvat technologieën zoals incidentele en verdeeld ophalen, taaloverschrijdende IR, samenvatten, filteren, en classificatie. Hier zijn een aantal belangrijke eigenschappen van "The Maki Project": · Geavanceerde Structured Query talen (met behulp van inquery en Indri) · Ondersteuning voor XML en gestructureerd document retrieval · Vaak gebruikt met een breed scala van onderzoek-test collecties (bijv TREC CD 1-5, wt10g, RCV1, gov, gov2) · Index uw webpagina's met een website zoekmogelijkheid "out-of-the-box" · Interactieve interfaces voor Windows, Linux, en Web · Distributed information retrieval en document clustering toepassingen · Cross-platform, snel en modulaire code geschreven in C ++ · C ++, Java en C # API's · Gratis en open-source software · In gebruik voor meer dan 6 jaar door een grote en groeiende gemeenschap van gebruikers Indexeren: · Meerdere indexering methoden voor kleine, middelgrote en grote (terabyte) collecties · Ingebouwde ondersteuning voor Engels, Chinees en Arabisch teksten · Porter en Krovetz woordstammen · Incrementeel indexeren · Out-of-the-box indexering ondersteuning voor TREC tekst, TREC Web, platte tekst, HTML, XML, PDF, MBox, Microsoft Word en Microsoft PowerPoint · Indexen inline en offset tekstannotaties (bijvoorbeeld part-of-speech en named entities) · Indexes document attributen retrieval: · Ondersteunt grote taalmodellering benaderingen zoals Indri en KL-divergentie, evenals vector ruimte, tf.idf, Okapi en inquery · Relevance- en pseudo-relevance feedback · Wildcardterm expansie (via Indri) · Passage en XML-element retrieval · Taaloverschrijdend retrieval · Smoothing via Dirichlet priors en Markov ketens · Ondersteunt willekeurig document strafblad (bijv., Page Rank, URL diepte) Wat is er nieuw in deze release: · 2799440 terminfo geretourneerd door IndriTermInfoList heeft geen posities · 2794361 harvestlinks niet in slaagt om de oogst directories · 2788507 KrovetzStemmerTransformation kan een buffer overflow · 2788504 AnchorTextAnnotator kan een buffer overflow · 2787935 pagerank dumpt kern als schakels pad is slecht · 2784994 Verkeerde artikel · 2783665 TextTokenizer voortijdig eindigt geciteerd tagkenmerken · 2782954 indri :: parse :: HTMLParser :: handleTag kan overstromen een buffer · 2772914 irevalGUI.jar geeft gek resultaten · 2772846 bin / ireval.jar is een ongeldig JAR-bestand (Lemur V48) · 2770916 documentLength buffer corruptie met meerdere threads · 2747981 WARCDocumentIterator mist documenten in WARC file · 2747707 TextTokenizer niet herkent sommige geciteerd tagkenmerken


Het Lemur-project Gerelateerde software

FindBin

HASKELL-toepassing voor het lokaliseren van de directory van het oorspronkelijke programma ...

158 2 KB

Downloaden

SCDOC

Gratis en Open Source Command-Line Utility die u zal helpen bij het maken, uitpakken en verifiëren van ingesloten documentatie ...

206 105 KB

Downloaden