Muinaut

MGUESSER is een stand-alone onderdeel van LibmnogoseSearch waarmee de tekenset en taal van een tekstbestand kan raden.
Download nu

Muinaut Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • GPL
  • Prijs:
  • FREE
  • Naam uitgever:
  • Alexander Barkov
  • Uitgever website:
  • http://www.mnogosearch.org/guesser/

Muinaut Tags


Muinaut Beschrijving

Muesser is een op zichzelf staand onderdeel van Libmnogosearch, waardoor het mogelijk maakt om karakteret en taal van een tekstbestand te raden. Muesser is een op zichzelf staande onderdeel van Libmnogosearch (een kern van de zoekmachine van Mnogo) waarmee karakteret en taal van een tekstbestand is geïmplementeerd, wordt geïmplementeerd met behulp van "N-Gram-gebaseerde tekstcategorisatie" -techniek die wordt geïmplementeerd in TextCat Taal Guesser geschreven in PERL (http://www.let.rug.nl/~vannoord/textcat/). Muesser is significant sneller dan de tekstcat, vooral op grote teksten. Dit pakket bestaat uit C geschreven algoritmen in Gram en een aantal kaarten voor teksten in verschillende talen en karaktersets. Kijk eens naar "Maps" -map van dit pakket om de momenteel ondersteunde talen en tekensets te controleren. Wat is er nieuw in deze release: · De optie -d-opdrachtregel is toegevoegd om taalkaarten van een niet-standaardmap te laden. · Een dikke darm -Separeerde lijst met mappen wordt ook ondersteund. · De -t-opdrachtregeloptie is toegevoegd om op te geven hoeveel top n-gram om in de uitgangskaart af te drukken. · De standaardwaarde is 200, die voor betere prestaties kan worden verlaagd of toegenomen Betere detectiekwaliteit. · Ongeveer 30 nieuwe modelkaarten werden toegevoegd.USAGEMGUESSER neemt een duidelijke tekstgegevens naar Stdin. Merk op dat andere "bijna-tekst" -formaten zoals HTML slechte resultaten zullen retourneren. In latere releases zal ik mogelijk een opdrachtregelschakelaar toevoegen om MULESSER te vertellen dat de invoergegevens HTML zijn. Muesser werkt prima voor teksten met grootte vanaf 500 bytes en langer. Kortere teksten zijn niet zo goed geraden. Om taal- en karakterreeks van een aantal tekstbestand te raden: MuDuesser


Muinaut Gerelateerde software

Zweven

Een WordPress-plug-in die trefwoorden vervangt met links en een optionele pop-up. ...

322

Downloaden