stemming

Python-implementaties van verschillende stemmingalgoritmen
Download nu

stemming Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Public Domain
  • Prijs:
  • FREE
  • Naam uitgever:
  • Matt Chaput
  • Uitgever website:
  • http://whoosh.ca

stemming Tags


stemming Beschrijving

Python-implementaties van verschillende stemmingalgoritmen Stemming is een Python-implementaties van de Porter, Paice-Husk, Porter2 en Lovins Stemmingalgoritmen voor Engels. Deze implementaties zijn eenvoudig en efficiënt, in tegenstelling tot sommige Python-versies van dezelfde algoritmen die op internet beschikbaar zijn. Dit pakket is een extractie van de stamingcode die is opgenomen in de Whoosh Search Engine.Note dat dit pure Python-implementaties zijn. Python Wrappers voor, b.v. De Snoball-stemmen en de C-implementatie van de Portier Stemmer zijn beschikbaar op PYPI en zullen sneller zijn als het gebruik van de gecompileerde code een optie is voor u.stemming-algoritmen proberen om achtervoegsels automatisch te verwijderen (en in sommige gevallen voorvoegsels) om de "root te vinden woord "of steel van een bepaald woord. Dit is handig in verschillende natuurlijke taalverwerkingscenario's, zoals Search.in General Porter2 is het beste algemene stemmingalgoritme, maar niet noodzakelijkerwijs het snelste of meest agressieve. Het stamming-pakket bevat modules voor elk algoritme (Lovins, Paicehusk, Porter en Porter2 ). Elke module bevat een STEM () -functie: >> van STEMMING.PORTER2 IMPORT STEM >> STEM ("factionally") factie (het Paice-Husk-algoritme maakt gebruik van aangepaste stamingsregelsets, dus de Paicehusk-module bevat ook een Paicehuskstemmer-klasse die u kunt instantiëren Met aangepaste regels.) De broncode voor dit pakket is beschikbaar op BITBUCKET: http: //bitbucket.org/mchaput/stemmingPlease Gebruik Bitbucket om bugrapporten of feature-aanvragen te besturen: http: //bitbucket.org/mchaput/stemMing/issues / Vereisten: · Python


stemming Gerelateerde software