Poliqarp

POLIQARP is een hulpprogramma voor het zoeken van grote corpora.
Download nu

Poliqarp Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • GPL
  • Prijs:
  • FREE
  • Naam uitgever:
  • Daniel Janus
  • Uitgever website:

Poliqarp Tags


Poliqarp Beschrijving

Poliqarp is een hulpprogramma voor het zoeken van grote corpora. Poliqarp is een hulpprogramma voor het zoeken van grote corpora. Hier zijn enkele belangrijke kenmerken van "poliqarp": Ondersteuning voor getagde corpora: · De gezochte collectie kan niet alleen onbewerkte tekst bevatten, maar ook informatie over de woorden en teksten die het vormen (grammaticale vormen van woorden; structuur van de teksten; verschillende meta-informatie over de teksten zoals auteurschap en datum van schrijven). Expressieve query-taal: Poliqarp's query-taal is gebaseerd op reguliere uitdrukkingen en stelt u in staat om niet alleen te zoeken naar een bepaald woord of reeksen van woorden, maar ook bijvoorbeeld voor: · Een bijvoeglijk naamwoord gevolgd door een zelfstandig naamwoord · Vijf zelfstandige naamwoorden op een rij · Vijf, zes of zeven zelfstandige naamwoorden op een rij · Een bepaald woord dat in de buurt komt, maar niet noodzakelijkerwijs de volgende, naar het andere gegeven woord · Woorden die beginnen met 'Z' die optreden in teksten die in de 19e eeuw worden gepubliceerd · Zinnen langer dan 100 woorden · ...en nog veel meer Ondersteuning voor positionele tagsets: · De aan woorden toegewezen tags kunnen een interne structuur hebben en deze structuur kan worden opgenomen in query's. Zo hebben zelfstandige naamwoorden gender, aantal of case, werkwoorden mogelijk aspect, enzovoort. · Dit is met name bruikbaar met talen die rijk zijn aan verbuiging, zoals Pools (in feite, Poliqarp is oorspronkelijk ontwikkeld en wordt gebruikt in een Pools CORPUS-project - de IPI PAN CORPUS). · Is niet afhankelijk van een bepaalde taget · Ondersteuning voor Unicode · U kunt corpora van teksten maken die in bijna elke taal in zijn inheemse script zijn geschreven - zijn het Engels, Pools, Japans of Thais - zolang ze zijn gecodeerd in het UTF-8-formaat. Ondersteuning voor dubbelzinnigheden: · Tags van een woord zijn niet noodzakelijk uniek: er kunnen situaties voorkomen waarin een woord op verschillende manieren kan worden geïnterpreteerd (en dus verschillende tags hebben toegewezen). Poliqarp kan dergelijke situaties aan en stelt u in staat om te zeggen of uw zoekopdracht overeenkomt met een van de mogelijke interpretaties of allemaal. Weinigen, indien aanwezig, andere concordancers hebben dit vermogen. Multi platform: · Poliqarp is geschreven in Java en Portable C, en is dus beschikbaar voor Windows en de meeste Unix-achtige systemen, waaronder Linux, * BSD en Solaris. Momenteel ondersteunt het alleen weinig endische architecturen, maar er is werk aan de gang om het endian-neutraal te maken. Efficiënt: · Het is moeilijk om de gemiddelde tijd van het zoeken naar een corpus te schatten, omdat het sterk afhangt van de structuur van de query. Simpele query's (voor een woord of zin) nemen echter een paar seconden, zelfs op corpora met meer dan honderd miljoen woorden (in termen van rauwe teksten, dat is verschillende gigabytes, waaronder tags en metadata!) Meer complexe query duurt meer om uit te voeren, maar Zelfs dan krijg je de resultaten zodra ze worden gevonden, dus je hoeft niet lang te wachten. Vrij: · Poliqarp is gratis / open source-software, beschikbaar onder de voorwaarden van de GNU General Public License. Vereisten: · Java 2 Standaard Edition Runtime-omgeving Wat is er nieuw in deze release: · Een belangrijke regressie in BPUGprade, die kan leiden tot gegevensverlies, was vastgesteld.


Poliqarp Gerelateerde software

Openphyra

OpenPhyra is een modulair en uitbreidbaar raamwerk voor het beantwoorden van open domeinvraag (QA). ...

483

Downloaden

Jabref

Jabref is een grafische Java-applicatie voor het beheren van BIBTEX (. BIB) -databases. ...

325

Downloaden