Noaho

niet-overlappende aho-corasick trie
Download nu

Noaho Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • MIT/X Consortium Lic...
  • Prijs:
  • FREE
  • Naam uitgever:
  • Jeff Donner
  • Uitgever website:
  • https://github.com/JDonner/

Noaho Tags


Noaho Beschrijving

Noaho biedt snelle, niet-overlappende simultaan meerdere trefwoord zoeken.Features: - 'Short' en 'Long' (langste matching-sleutel) Zoekopdrachten, zowel eenmalige als iteratie over alle niet-overlappende zoekwoorden in sommige tekst .- Werkt met beide Unicode en str in Python 2, en Unicode in Python 3 (het zijn allemaal UCS4 onder de motorkap). - Hiermee kunt u een willekeurig Python-objectpayload koppelen aan elk trefwoord en ondersteunt DICT-operaties LEN (), [] en 'in' Voor de trefwoorden (hoewel No Del of Traversal) .- Doet de 'compilatie' (generatie van Aho-Corasick-uitvalverbindingen) van de trie on-demand; U kunt het toevoegen van trefwoorden en het downloaden van tekst vrijelijk .- Kan commercieel worden gebruikt, het is onder de minimale, MIT-licentie. ANDI-FUNCTIES: - Zal geen overlappende zoekwoorden vinden (bijv. Gegeven zoekwoorden "ABCDE" en 'DEFGH', niet vinden " DefGH "in" ABCDEFGH "; zou zowel in" abcdedefgh ") vinden, tenzij je handmatig langs de touwtjes bewaart, een personage tegelijk, dat het doel zou verslaan. Het pakket 'Acora' is een alternatief pakket voor dit gebruik .- Ontbreekt overlapping, vind _Short is een beetje nutteloos .- Mist sleutelheratie en deletie uit de mapping (DICT) protocol - geheugen lekkende ongeteste (zou OK moeten zijn, maar ...) - Nee / Testcase / voor Unicode in Python / voor Unicode in Python 2 ( Heeft de handmatige test echter) - Unicode-tekens als UCS4 vertegenwoordigd, en elk personage heeft zijn eigen hashtable, dus het is relatief geheugen-heavy.- vereist een C ++ compiler.bug-rapporten en patches welkom natuurlijk!


Noaho Gerelateerde software