Metafoon

een Python-implementatie van de metafoon-algoritmen
Download nu

Metafoon Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • BSD License
  • Prijs:
  • FREE
  • Naam uitgever:
  • Andrew Collins
  • Uitgever website:
  • https://github.com/oubiwann/

Metafoon Tags


Metafoon Beschrijving

Metafoon is een implementatie van Python van de metafoon-algorithms.metaphoneas beschreven op de Wikipedia-pagina, het originele metafoon-algoritme werd in 1990 gepubliceerd als een verbetering van het Soundex-algoritme. Net als Soundex was het beperkt tot Engels-alleen-gebruik. Het metafoon-algoritme produceert geen fonetische weergaven van een invoerwoord of naam; Integendeel, de uitvoer is een opzettelijk geschatte fonetische weergave. De geschatte codering is noodzakelijk om rekening te houden met de manier waarop sprekers hun uitspraken en misspellen variëren of anderszins variëren van woorden en namen die ze proberen te spellen. Dubbele metafonethe dubbele metafoon fonetisch coderingsalgoritme is de tweede generatie van het metafoon-algoritme. De implementatie ervan werd beschreven in het nummer van JUNI 2000 van C / C ++ -gebruikersjournaal. Het maakt een aantal fundamentele ontwerpverbeteringen over de originele metafoon-algorithm.it wordt "dubbel" genoemd omdat het zowel een primaire als een secundaire code voor een tekenreeks kan retourneren; Dit is goed voor een aantal dubbelzinnige gevallen, evenals voor meerdere varianten van de achternamen met gemeenschappelijke afkomst. Als u bijvoorbeeld de naam "SMITH" coderen, levert een primaire code van SM0 en een secundaire code van XMT op, terwijl de naam "Schmidt" een primaire code van XMT "levert en een secundaire code van SMT - beide hebben XMT in gebruikelijk.Dubbele metafoon Probeert rekening te houden met myriad onregelmatigheden in het Engels van Slavisch, Germaans, Keltisch, Grieks, Frans, Italiaans, Spaans, Chinees en andere herkomst. Zo maakt het gebruik van een veel complexere regelset voor codering dan zijn voorganger; IT-tests voor ongeveer 100 verschillende contexten van het gebruik van de letter C alleen. HistoryThis is een kopie van het Python Double Metafoon-algoritme, genomen van het werk van Andrew Collins, een implementatie van Python van een algoritme in C oorspronkelijk gemaakt door Lawrence Philips . Sindsdien zijn verbeteringen gemaakt door verschillende medewerkers, zichtbaar in de Git History.a Resources Directory is bij dit project inbegrepen, dat het volgende bevat: - het originele C ++ -bestand door Lawrence Philips- Kevin Atkinson's verbeteringen aan IT- A C-implementatie (voor Gebruik in een perl-extensie) door Maurice AubreyThe Dragers of the Python-versie, oorspronkelijk gestart door Andrew Collins zijn: - Andrew Collins- Chris Leong- Matthew Somerville- Richard Barran-Maximillian Dornseif- Sebastien Metrot- Duncan McGreggorusagerunning De eenheid Testsmetafoon gebruikt het UnitTest-pakket Van de standaardbibliotheek, en als zodanig zijn de tests runable door de meeste testlopers. Als je neus hebt geïnstalleerd, kun je het volgende doen: Git Checkout https://github.com/oubiwann/metaphone.git CD Double-metafoon Nosetests -V. Als je hebt geïnstalleerd, kun je doen: proef ./metaphoneExample codeethe Unit-tests zijn vol van voorbeelden, dus zorg ervoor dat u die uitchecken. Maar hier is een smaak: Python >>> van metafoon import doublemetafoon >>> doublemetaphone ("architect") ("Arktkt", "") >>> doublemetaphone ("Bajador") ("PJTR", "PHTR") in de Wild de volgende ontwikkelaars / projecten maken gebruik van deze bibliotheek: - Andrew Collins gebruikte zijn oorspronkelijke code in verschillende muziekprojecten en het omgaan met verkeerd gespelde tekst uit gegevens van verschillende webservices. Dit werd vervolgens geïntegreerd met PLONE / ZOPE-projecten.- Matthew Somerville gebruikt het op Theatricalia om mensen te doen die matchen, en het lijkt vrij goed te werken. De database slaat de dubbele metafoons op voor de eerste en achternaam en berekent u vervolgens bij het zoeken gewoon de dubbele metafoons van wat is ingevoerd en op zoek naar alles wat overeenkomt .- Duncan McGreggor gebruikt het op het Thark-project om meer volledige tekstzoekmogelijkheden voor THARK-projecten voor te leggen Indo-Europese taal woordenlijsten en woordenboeken.Product's startpagina


Metafoon Gerelateerde software