Ellogon

Elogon is een cross-platform, multi-lingual, algemene taaltechniek omgeving
Download nu

Ellogon Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • GPL
  • Naam uitgever:
  • Georgios Petasis
  • Besturingssystemen:
  • Windows All
  • Bestandsgrootte:
  • 10.6 MB

Ellogon Tags


Ellogon Beschrijving

Ellogon is een cross-platform, multi-lingual, general-purpose taaltechnologie milieu, ontwikkeld om zowel onderzoekers die onderzoek doen in de computationele taalkunde, evenals bedrijven die produceren helpen en leveren taaltechnologie Ellogon als taaltechnologie platform biedt een uitgebreide set van faciliteiten, waaronder hulpmiddelen voor het verwerken en visualiseren van tekstuele / HTML / XML-gegevens en bijbehorende taalkundige informatie, ondersteuning voor lexicale middelen (zoals het maken en insluiten lexicons), tools voor het maken geannoteerde corpora, de toegang tot databases vergelijken geannoteerde data, of transformerende linguïstische gegevens in vectoren voor gebruik met verschillende algoritmen machine learning. Tijdens het laatste decennium, hebben een groot aantal software-infrastructuur ter vergemakkelijking van RD op het gebied van natuurlijke taalverwerking is gepresenteerd. Sommige van deze infrastructuren, zoals LT-NSL / LT-XML gereedschappen of GATE, zijn zeer populair geworden als ze aan een breed scala van taken door veel instellingen zijn toegepast in de hele wereld. Ellogon behoort tot de categorie van de referentiële of annotatie gebaseerde platforms, waar de taalkundige informatie afzonderlijk van de tekstuele gegevens worden opgeslagen, met verwijzingen naar de oorspronkelijke tekst. Op basis van de tipgever datamodel, Ellogon biedt infrastructuur voor: · Het beheren, opslaan en uitwisselen van tekstuele gegevens, alsmede de bijbehorende taalkundige informatie. · Het creëren, inbedding en beheren van taalkundige verwerking componenten. · Voor communicatie tussen verschillende taalgebieden componenten brengen door een geschikte (API). · Visualiseren tekstuele gegevens en bijbehorende taalkundige informatie. Ellogon deelt dezelfde data model als de tipgever architectuur. Als gevolg van deze, deelt een aantal basisfuncties met andere tipgever gebaseerde infrastructuren, zoals GATE. Maar het biedt ook een groot aantal functies die het onderscheiden van dergelijke infrastructuren. De centrale voor het opslaan van data in Ellogon is de verzameling. Een collectie is een eindige set van documenten. Een Ellogon document bestaat uit tekstuele gegevens, alsmede linguïstische informatie over de tekstuele gegevens. Deze linguïstische informatie wordt opgeslagen in de vorm van attributen en annotaties. Een attribuut associeert een specifiek type van informatie met een getypte waarde. Een aantekening associeert willekeurige informatie (in de vorm van kenmerken) met delen van tekstgegevens. Elk dergelijk deel, genaamd overspanning bestaat uit twee offsets karakter aangeeft het begin en het einde van het gedeelte karakters, gemeten vanaf het eerste teken van enige tekstgegevens. Aantekeningen typisch uit vier elementen: · Een numerieke identificatie. Deze identificator is uniek voor elke aantekening in een document en kan worden gebruikt om de annotatie ondubbelzinnig te identificeren. · Een type. Annotatie types zijn tekstuele waarden die worden gebruikt voor het classificeren annotaties in categorieën. · Een set van overspanningen dat het bereik van de geannoteerde tekstuele gegevens aan te duiden. · Een set van attributen. Deze attributen meestal coderen de nodige taalkundige informatie. Ellogon in zijn huidige vorm voldoet aan al deze eisen. Zoals Ellogon is gebaseerd op de tipgever architectuur, deelt zij vele fundamentele eigenschappen met andere tipgever gebaseerde infrastructuren zoals GATE. Echter, Ellogon biedt een aantal belangrijke eigenschappen die het onderscheiden van soortgelijke infrastructuren: · Gemakkelijk Component Development Het is vrij gemakkelijk om het proces van het ontwikkelen van nieuwe componenten te begrijpen en ze te ontwikkelen met behulp van de functionaliteiten die door Ellogon. Daarnaast is er een breed scala aan programmeertalen voor component ontwikkeling worden ondersteund, waaronder C, C ++, Java, Tcl, Perl en Python. · Integrated Development Environment Ellogon werkt als een geïntegreerde ontwikkelomgeving, omdat het volledige ondersteuning van de ontwikkelingscyclus van een component. Componenten kunnen worden gemaakt, bewerkt gecompileerd en gekoppeld (of toepassing) vanuit Ellogon. Verder kunnen C / C ++ / Java componenten worden gelost, aangepast, gecompileerd en geladen in Ellogon zonder stoppen van Ellogon. De mogelijkheid om te lossen of reload alle componenten is essentieel omdat het aanzienlijk kan verminderen ontwikkelingscyclus, omdat component wijzigingen onmiddellijk kunnen worden geëvalueerd. · Een direct component "instrumentarium" gebruiken Ellogon is uitgerust met een groot aantal kant-en-klare tools voor het uitvoeren van taken zoals geannoteerde corpora creatie, vector generatie of het vergelijken van gegevens. Bovendien zijn verschillende monstercomponenten verstrekt die kunnen worden aangepast aan verschillende domeinen en talen, die een aantal basistaken zoals tokenizatie, part-of-speech-tagging of de opzoeking van de lijst met spraak tagging uitvoeren. Ten slotte biedt Ellogon verschillende gegevensvisualisatietools, variërend van eenvoudige kijkers voor de annotatiedatabase naar kijkers die in staat zijn om hiërarchische informatie weer te geven, zoals syntaxisbomen. · Eenvoudige implementatie Aangezien Ellogon een decompoleerbare architectuur implementeert, is het extreem eenvoudig om een eenvoudig te gebruiken product te maken van een set componenten die een specifieke taak uitvoeren. Alle componenten samen met de benodigde Ellogon-onderdelen kunnen worden verpakt in een enkel uitvoerbaar bestand (dat geen installatie nodig heeft) of als een toepassing (die niet onder meerdere operatiesystemen kan worden uitgevoerd). Deze gespecialiseerde applicaties kunnen in elk systeem worden gedistribueerd en gebruikt, zelfs als Ellogon niet is geïnstalleerd op het systeem. Vereisten: · TCL / TK 8.4 (of nieuwer), · Java JDK / JRE 1.4.1 (optioneel), · PerL 5.8.1 (optioneel), · Python 2.2 (optioneel).


Ellogon Gerelateerde software