| pyredise Een eenvoudige en snelle zoekmachine |
Download nu |
pyredise Rangschikking & Samenvatting
- Vergunning:
- The Apache License 2.0
- Naam uitgever:
- Christos Spiliopoulos
- Uitgever website:
- http://github.com/hymloth/
pyredise Tags
pyredise Beschrijving
Pyredise is een eenvoudige en snelle zoekmachine gebaseerd op Python en Redis.Installatie Git Clone Git@github.com: Hymloth / Pyredise.git CD Pyredise Sudo Python Setup.py InstallationStructions: - U moet Redis correct zijn geïnstalleerd en geconfigureerd als een start Punt, kijk eens naar Corpus_Handler.py- Initialize IT met een Python-Redi-instantie: importeer redisimport corpus_handlerdb = = redis.redis (host = 'localhost', poort = 6379, db = 0) cp = corpus_handler.corpuspushandler (db = DB) - Op de een of andere manier moet u een aantal documenten hebben om te indexeren. Dan hebt u alleen de ID (DOC_ID), de titel en de inhoud van het document nodig. # U moet een woordenboek verstrekken met het volgende formaat: DOC = {"ID": DOC_ID, "TITLE": DOC_TITLE, "INHOUD": DOC_CONTENT } CP.IDEX (DOC) FILTERS: - / PURE_TFIDF: Ranking gebaseerd alleen op TF-IDF-schema- / titel_only: titel matching- / compleet: ranking gebaseerd op TF-IDF-schema, nabijheid en titelImport query_handlerimport redisdb = = redis.redis ( Host = 'localhost', poort = 6379, db = 0) QH = query_handler.QueryHandler (db = dB) # Probleem enkele query's, retourneren van een lijst met tuples zoals Print QH.Process_Query ("Google-beveiligingsgegevens / pure_tfidf") # Ranking alleen volgens TF-IDFPRINT QH.PROCESS_QUERY ("Google-beveiligingsgegevens / compleet") # CUTERPRINT QH.PROCESS_QUERY ("Google-beveiligingsgegevens / titel_only") # Zoeken in titels voor degenen die niet hebben gemerkt, pyredise wordt genoemd ter ere van PY (Thon) Redi (S) S (Earch) E (Ngine) -producten Homepage
pyredise Gerelateerde software