microsearch

Een kleine zoekbibliotheek
Download nu

microsearch Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • BSD License
  • Prijs:
  • FREE
  • Naam uitgever:
  • Daniel Lindsley
  • Uitgever website:
  • http://toastdriven com

microsearch Tags


microsearch Beschrijving

MicroSearch is een kleine python zoekbibliotheek. Primair bedoeld om een leermiddel te zijn om de fundamenten van Search.Usvolle te leren om in te loggen in Python-apps waar je niet wilt / nodig hebt iets zo complex als Lucene.Part van mijn (aankomende) 2012 Pycon Talk - https://us.pycon.org/2012/schedule/presentation/66/USAGEEXAMPLE: INGROND MICROSEARCH # Maken een instantie, wijzend naar waar de gegevens moeten worden opgeslagen.ms = MicroSearch.microSearch ('/ TMP / MicroSearch ') # Index Sommige data.ms.index (' Email_1 ', {' Text ': "Peter, \ N \ NI'm Gaan die TPS-rapporten op mijn bureau morgen op mijn bureau nodig hebben! En opruimen van uw bureau! \ N \ NLumbergh "}) Ms.index ('Email_2', {'Tekst': 'Iedereen, \ n \ nm-mmm-mijn rode nietmachine is verdwenen. HH-heeft een A-an-Iedereen die het heeft gezien? \ N \ Nmilton '}) Ms.index (' Email_3 ', {' Tekst ': "Peter, \ N \ Nyeah, ik zal je nodig hebben om zaterdag binnen te komen. Vergeet die rapporten niet. \ N \ NLumbergh"} ) Ms.index ('Email_4', {'Text': 'Hoe voel je je het over het worden van management? \ n \ nDe bobs'}) # Zoeken op it.Search ('Peter') Ms.Search ('TPS Report') ShortComeThis Bibliotheek is bedoeld om anderen te helpen leren. Hoewel het volledige testdekking heeft, is het mogelijk niet geschikt voor productieverbruik. Redenen die u misschien niet wilt gebruiken in Real Code: - Geen enkele concurrency-ondersteuning probeert atomisch met bestanden te werken, maar er zijn geen sloten, dus het is mogelijk om te schrijven om te overlappen tussen processen- Misschien thread-safe? Vrijwel alles is op een instantie, maar ik heb het niet uitgebreid getest met Dreiging- Geen ondersteuning voor het verwijderen van documenten als een bestaand document verandert of wordt verwijderd, de muffe gegevens zullen achterblijven in de index-directory, Het verplaatsen van de Docs en het opnieuw uitspreken van hen: / - Alleen N-Grams worden ondersteund omdat het schrijven van een volledige portier of sneeuwbal stemmender is dan de behoeften van deze bibliotheek - geen aanwijzing op prestaties op schaal Dit is een bewijs van-concept en leergereedschap, Niet Lucene! Met een MBP van 2011 op de eerste 1.2K DOCS van het ENRON CORPUS: - Indexering is vrij langzaam bij ~ 1 Document per second-search is vrij snel bij ~ 0,007 SEC per query- RAM heeft nooit meer dan 15 MB bij het indexeren, 10 MB wanneer Searching- Script in de bron Repo als Enron_Bench.py.Running Testswith Een bron Afrekenen, uitvoeren: in Python 2: Python -m Unittest2 Testsin Python 3: Python-m Unittest teststests moeten te allen tijde worden doorgegeven onder zowel Python 2.7 en Python 3.2.Product's startpagina


microsearch Gerelateerde software

jsonrpclib-ned14

Dit project is een implementatie van de SSON-RPC V2.0-specificatie (achterwaarts compatibel) als een klant ... ...

85

Downloaden

zc.z3monitor

Een opdrachtregelinterface voor een netwerk toegankelijke om een ZOPE3-proces te controleren ...

227

Downloaden