Tekst :: bloei

Tekst :: Bloom kan de ondertekening van de bloei van een reeks termen evalueren.
Download nu

Tekst :: bloei Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Perl Artistic License
  • Prijs:
  • FREE
  • Naam uitgever:
  • Andrea Spinelli and Walter Vannini
  • Uitgever website:
  • http://search.cpan.org/~aspinelli/Text-Document-1.07/Bloom.pod

Tekst :: bloei Tags


Tekst :: bloei Beschrijving

Tekst: Bloom kan de ondertekening van de bloei van een reeks termen evalueren. Tekst :: Bloom kan de ondertekening van de bloei van een reeks termen evalueren. Synopsis Mijn $ B = Tekst :: Bloom-> Nieuw (); $ B-> Compute (QW (foo bar baz)); mijn $ SIG = $ B-> Writetosters (); $ B-> Writetofile ('afile.sig'); Mijn $ B2 = Tekst :: Bloom :: NewFromFile ('Afile.sig'); Mijn $ B3 = Tekst :: Bloom-> Nieuw (); $ B3-> Compute (QW (Foo Bar Barbaz)); mijn $ sim = $ b-> gelijkenis ($ B2); Mijn $ B4 = Tekst :: Bloom :: Newfromstring ($ sig); Tekst :: Bloei past de bloeifiltertechniek toe op de statistische analyse van documenten. De voorwaarden in het document zijn gekwantiseerd met behulp van een basis-36 radix-weergave; Elke term komt aldus overeen met een geheel getal in het bereik 0..p-1, waarbij P een prime is, momenteel ingesteld op de grootste prime jonger dan 2 ^ 32.Elke gekwantiseerde waarde wordt in het bereik van de gek kwantificeerde waarde in kaart gebracht in het bereik 0..Size -1, waar maat een geheel getal is dan P, momenteel 2 ^ 17, met behulp van een familie van hash-functies, berekend door de HASHV-functie. Elke hashed-waarde wordt gebruikt als de index in een grote bitvector. Bits die overeenkomen met voorwaarden die in het document aanwezig zijn, zijn ingesteld op 1; Alle andere bits zijn ingesteld op 0.Gebonden, botsingen kunnen in verschillende termen hetzelfde bit worden ingesteld. Hieruit volgt dat, als het document n duidelijke termen bevat, in de resulterende bitvector in de meeste N * D-bits is ingesteld op 1.De resulterende bitreeks is een zeer compacte weergave van de aanwezigheid / afwezigheid van termen in het document, en is daarom gekenmerkt als een handtekening. Bovendien is het niet afhankelijk van een vooraf ingesteld woordenboek van termen. De handtekening kan worden gebruikt voor: testen of een bepaalde reeks termen aanwezig is in het document, het berekenen van welke fractie van de voorwaarden voor twee documenten gemeenschappelijk is. De bitvertegenwoordiging kan worden geschreven en lezen uit een bestand. Tekst :: BLOW Prept een koptekst op de juiste beek; Bovendien, telkens wanneer het pakket comprimeert :: ZLIB is beschikbaar, wordt de bitvector gecomprimeerd, zodat schijfruimte-vereisten drastisch worden verminderd, vooral voor kleine documenten. De functie van de hash is duidelijk een cruciale component van het filter; De referentie-implementatie maakt gebruik van een Radix-weergave van snaren. Elke term moet daarom overeenkomen met de reguliere expressie /+/. Er zijn nogal wat levensvatbare alternatieven, die kunnen worden nagestreefd door de methode quantizev.requirements te onderhouden en opnieuw te definiëren: · PERL-vereisten: · Perl


Tekst :: bloei Gerelateerde software

Neem

NEEM is een bibliotheek die een implementatie van epidemische multicast biedt. ...

148

Downloaden