Wordtabulator

Procesteksten met UTF-8-codering en maak index van woordelementen.
Download nu

Wordtabulator Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • GPL
  • Prijs:
  • Free
  • Naam uitgever:
  • By Sergey Logichev
  • Besturingssystemen:
  • Windows 2000, Windows Vista, Windows, Windows 7, Windows XP
  • Aanvullende vereisten:
  • None
  • Bestandsgrootte:
  • 2.6 MB
  • Totaal aantal downloads:
  • 83

Wordtabulator Tags


Wordtabulator Beschrijving

WordTabulator is bedoeld voor tekstanalyse. Met behulp van WordTabulator kunt u index van Word-elementen genereren die wordt geëxtraheerd uit gedefinieerde tekstset. Word-elementen kunnen woorden zijn, n-gram (van gedefinieerde grootte) of zinsdelen (syntagmes). Het programma kan teksten verwerken zoals in gewone 2-bytes-codering (ANSI), zoals in Multibyte UTF-8-codering. Bronteksten worden gedefinieerd als een set vlakke tekstbestanden of HTML / XML / SGML-documenten. In het laatste geval kan het programma inhoud van Markup filteren. Bovendien kunt u alleen gedefinieerde inhoud verwerken binnen geselecteerde gepaarde tags. Of u kunt die inhoud overslaan van verwerking. Het bevat Morfologiemodule voor Russische, drie verschillende indelingen van uitvoerindex, drie verschillende soorten woordelementen (woorden, n-gram en zinsdelen), browser van context en echte alfabetische volgorde.


Wordtabulator Gerelateerde software