De lemur toolkit

Gratis taalmodeler voor Mac OS X
Download nu

De lemur toolkit Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Freeware
  • Prijs:
  • FREE
  • Naam uitgever:
  • The Lemur Team
  • Uitgever website:
  • http://www.lemurproject.org/
  • Besturingssystemen:
  • Mac OS X
  • Bestandsgrootte:
  • 63.2 MB

De lemur toolkit Tags


De lemur toolkit Beschrijving

Gratis taal modeler voor Mac OS X De Maki Toolkit is ontworpen voor onderzoek op taalmodellering en uitwisseling van gegevens mogelijk, waaronder technologieën als ad hoc en gedistribueerde retrieval, samenvatting, taaloverschrijdende IR, filtreren en classificatie. Wat is er nieuw in deze release: · 4.9 corrigeert diverse problemen in de 4.8 distributie pakket, voorziet in een nieuwe · FileClassEnvironment voor WARC file input, verschillende indexering snelheid · Optimalisaties voor indri; en meer. · Toepassingen gecompileerd met de Lemur Toolkit hen dient de volgende · Bibliotheken: z, iberty, pthread en m on Linux, en bovendien socket · En NSL op solaris. Applicaties die gebouwd zijn in Visual Studio moet de · Extra bibliotheek wsock32.lib. De java jar bestanden werden gebouwd met · Java 5 (JDK 1.5.0). De java UI's vereisen Java 5. Wij hebben getest met behulp van GCC · 3,2 (Solaris), 3.2.2 (Linux), 3,4 (Linux), 3.4.3 (Linux x86_64), 4.0.2 (Linux) · 4.3.1 (OS / X), VC ++ .NET 7.1 (Windows XP) en Visual Studio 2005 (Windows · XP). Verbeteringen: · De LayoutManager beperkingen zijn gewijzigd om de resize verbeteren · Gedrag van de componenten. · De Querylogbestand Toolbar en server ondersteuning van het automatisch uploaden van log · Bestanden op een geregelde basis. Deze voorkeur kan door de gebruiker van het instellen · Werkbalk om volledig automatisch, automatisch met een bevestiging nodig · Voor uploaden, of handmatig uploaden alleen. · Een nieuwe FileClassEnvironment, WARC, is toegevoegd aan indri. deze omgeving · Maakt het indexeren van de ClueWeb09 corpus, · Http: //boston.lti.cs.cmu.eduData/clueweb09/ · Indri indexering snelheid optimalisaties, het verstrekken van 5-15% speedup voor GOV2 (25 miljoen documenten) sized collecties: · 1) vermindering van het aantal geheugentoewijzingen / deallocations in · IndexWriter :: _ lookupTermID. · 2) Gebruik de tabellen volledige optie, -Cf van flex. · 3) Doe niet ASCII geval normalisatie in · UTF8CaseNormalizationTransformation, want het is overbodig. · 4) Gebruik hash_set van het STL in plaats van string_set voor stopwoorden. · 5) Als de verwijderde telling 0 in DeletedDocumentList, hoeft de lees niet verwerven · Slot alvorens terug te keren vals. · 6) Gebruik trim, in plaats van samen te voegen, in de RepositoryMaintenanceThread, om · Het aantal keren tijdelijke indexen worden gekopieerd. Stop het verzamelen van Trim · Kandidaten die een index tweemaal zo groot als de voorgaande index · Tegengekomen. · 7) Neem de grootte van de DiskIndexes rekening gehouden bij het schatten van het geheugen · Gebruik. · 8) Beperk de totale hoeveelheid geheugen die wordt gebruikt om cache document lengtes 20MB · (5.000.000 documenten).


De lemur toolkit Gerelateerde software

Bakker

Eenvoudig te gebruiken Ruby-gebaseerde tool voor het hernoemen en kopiëren van bestanden voor back-up ...

164 25 KB

Downloaden

knobbel

Curses-gebaseerde browserhulpprogramma voor het bladeren van de uitvoer van programma's ...

153 94 KB

Downloaden