AI :: Categorizer

AI :: Categorisator is een PERL-module voor automatische tekstcategorisatie.
Download nu

AI :: Categorizer Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • GPL
  • Prijs:
  • FREE
  • Naam uitgever:
  • Ken Williams
  • Uitgever website:
  • http://search.cpan.org/~kwilliams/Module-Build-0.2808/lib/Module/Build/Compat.pm

AI :: Categorizer Tags


AI :: Categorizer Beschrijving

AI :: Categorisator is een PERL-module voor automatische tekstcategorisatie. AI :: Categorisator is een PERL-module voor automatische tekstcategorisering.Synopsis Gebruik AI :: Categorizer; Mijn $ C = Nieuwe AI :: Categorizer (... Parameters ...); # Voer een compleet experiment uit - training op een corpus, testen op een test # set, het afdrukken van een samenvatting van de resultaten naar stdout $ c-> run_Experiment; # Of, voer de delen van $ C-> Run_Experiment afzonderlijk $ C-> Scan_features uit; $ c-> read_training_set; $ c-> trein; $ c-> evalueer_test_set; Print $ c-> stats_table; # Na de training, gebruik de leerling voor categorisering mijn $ l = $ c-> leerling; Terwijl (...) {mijn $ D = ... een document maken ... mijn $ hypothese = $ l-> categoriseer ($ d); # Een AI :: Categorizer :: Hypothese Object Afdrukken "toegewezen categorieën:", Join ',', $ Hypothese-> Categorieën, "N"; Print "Beste Categorie:", $ Hypothese-> Best_category, "N"; } AI :: Categorisator is een raamwerk voor automatische tekstcategorisatie. Het bestaat uit een verzameling Perl-modules die gemeenschappelijke categorisatietaken implementeren en een reeks gedefinieerde relaties tussen die modules. De verschillende details zijn flexibel - u kunt bijvoorbeeld kiezen welk categoriseringalgoritme te gebruiken, welke functies (woorden of anderszins) van de documenten moeten worden gebruikt (of hoe u deze functies automatisch kiest), welk formaat de documenten in- op. Het basisproces van het gebruik van deze module zal meestal een verzameling van vooraf gecategoriseerde documenten worden verkregen, waardoor een "Knowledge-set" -vertegenwoordiging van die documenten wordt geclassificeerd, een indeling opleiding op die kennisset en de opgeleide categorizer op te slaan voor later gebruik. Er zijn verschillende manieren om dit proces uit te voeren. De Module op het hoogste niveau ::: Categorizer Module biedt een overkoepelende klasse voor operaties op hoog niveau, of u kunt de interfaces van de afzonderlijke klassen in het raamwerk gebruiken. Een eenvoudig voorbeeldcript dat een trainingscorpus leest, een categoratoris en test de Categorizer op een test Corpus, wordt gedistribueerd als bijv. / demo.pl .Disclaimer: de resultaten van een van de machine-leeralgoritmen zijn verre van onfeilbaar (dicht bij feilibel?). Categorisering van documenten is vaak een moeilijke taak, zelfs voor mensen die goed zijn opgeleid in het specifieke middel van kennis, en er zijn veel dingen die een mens zou kunnen beschouwen dat geen van deze algoritmen overweegt. Dit zijn alleen statistische tests - op zijn best zijn ze nette trucjes of behulpzame assistenten, en in het slechtste geval zijn ze totaal onbetrouwbaar. Als u van plan bent deze module te gebruiken voor iets heel belangrijks, is menselijk toezicht essentieel, zowel het categoriseringsproces als de eindresultaten. Zie de documentatie van elke afzonderlijke module voor de gebruiksgegevens. Vereisten: · Perl


AI :: Categorizer Gerelateerde software