Gamera

Een programmeerkader voor documentherkenning.
Download nu

Gamera Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • GPL
  • Prijs:
  • FREE
  • Naam uitgever:
  • Michael Droettboom
  • Uitgever website:
  • http://ldp.library.jhu.edu/projects/gamera/

Gamera Tags


Gamera Beschrijving

Een programmeerraamwerk voor documentherkenning. Gamera-project is een raamwerk voor het creëren van gestructureerde documentanalyse-toepassingen door domeindeskundigen. Domeindeskundigen zijn particulieren die een sterke kennis hebben van de documenten in een verzameling, maar hebben mogelijk geen formele technische achtergrond. Het doel is om een tool te maken die gebruik maakt van hun kennis van de doeldocumenten om aangepaste applicaties te maken in plaats van aaneen te komen Vereisten met een monolithische applicatie. Dit papier geeft een overzicht van de architectuur- en ontwerpprincipes van Gamera.Duiding-erkenningssystemen voor moeilijke historische documenten vereist experimenten, omdat de oplossing vaak niet voor de hand ligt. Daarom is het primaire doel van Gamera om een efficiënte test-en-verfijning ontwikkelingscyclus te ondersteunen. Virtueel elk uitvoeringsdetail wordt aangedreven door dit doel. Python werd bijvoorbeeld gekozen als de kerntaal vanwege de introspectiecapaciteiten, dynamische typen en gebruiksgemak. Het is gebruikt als een eerste programmeertaal met aanzienlijk succes .c ++ wordt gebruikt om plug-ins te schrijven waar runtime-prestaties een prioriteit zijn, maar zelfs in dat geval is het Gamera-plug-in-systeem ontworpen om het zo eenvoudig mogelijk schrijfuitbreidingen te maken. Gamera bevat een volwaardige grafische gebruikersinterface die een aantal snelkoppelingen biedt voor training, evenals inspectie van de resultaten van algoritmen bij elke stap. Die het gemak van experimenten verbeteren, hopen we de kracht te ontwikkelen om erkenningssystemen met die te ontwikkelen die de beste documenten begrijpen. We verwachten ten minste twee soorten ontwikkelaars om met het systeem te werken: die met een technische achtergrond die algoritmen aan het systeem toevoegt, en die werken aan de aggregatie van hoger niveau van die stukken. Het is belangrijk om dit onderscheid te merken, aangezien die groepen verschillende vaardigheden en vereisten vertegenwoordigen. Aan toevoeging van de ondersteuning van de ontwikkeling van test- en verfijning, heeft Gamera ook verschillende andere voordelen die belangrijk zijn voor grootschalige digitaliseringsprojecten in het algemeen. Dit zijn: · Open source-code en normen-naleving, zodat de software goed kan communiceren met andere delen van een digitalisatiekader · Platformonafhankelijkheid, die op verschillende besturingssystemen wordt uitgevoerd, waaronder Linux, Microsoft Windows en Mac OS-X · een workflowsysteem Om taken op hoog niveau te combineren · Batch-verwerking · A Unit-Testing Framework om de juistheid te garanderen en regressie te voorkomen · Gebruikersinterface-componenten voor ontwikkeling en classificatietraining · Herkenningvertrouwenuitvoer zodat verzamelmanagers eenvoudig documenten of verschillende erkenningstrategieën kunnen targeten. Gamera heeft een modulaire plug-in-architectuur. Deze modules voeren doorgaans een van de vijf documentherkenningstaken uit: 1. Pre-processing2. Documentsegmentatie en analyse3. Symboolsegmentatie en classificatie4. Syntactische of structurele analyse5. Uitgaande van deze taken kan willekeurig ingewikkeld zijn, meerdere strategieën of modules inhouden, of volledig worden verwijderd afhankelijk van het specifieke erkenningsprobleem bij de hand. De werkelijke stappen die een volledig herkenningssysteem vormen, worden volledig gecontroleerd door de gebruiker. Pre-verwerking omvat standaard beeldverwerkingsactiviteiten zoals ruisverwijdering, vervaging, de-skewing, contrastafstelling, verscherping, binarisatie en morfologie. Houd aandacht aan en verfijning van deze stappen is bijzonder belangrijk bij het werken met gedegradeerde historische documenten. Wat is er nieuw in deze release: · Plug-ins to_numpy en from_numpy toegevoegd voor ondersteuning van Tumpy; De verwijderde numerieke en numarry-modules zijn vervangen door Numpy · Hoogtepunt werkt ook met Greyscale en Onebbit-afbeeldingen · Gecorrigeerde grootte-functie in Vigra · De KNN-classificator kan nu verschillende betrouwbaarheidsmaatregelen voor de hoofd-ID retourneren die door de gebruiker worden geselecteerd. Zie de Classifier API-documentatie voor meer informatie. · KNN-classifier werkt nu zoals verwacht wanneer K> 1; Tot nu toe werd id_name door vertrouwen gesorteerd, wat betekende dat altijd het verst van de dichtstbijzijnde buren werd teruggestuurd als main_id · Compileer nu met Python 2.6 (dankzij Prapat Suriyaphol)


Gamera Gerelateerde software

SiOx

SiOx is een Java SDK die een generieke segmentatie-engine biedt. ...

246

Downloaden

Scheur

SCHUR is een stand-alone programma voor het interactief berekenen van eigenschappen van leugengroepen en symmetrische functies. ...

168

Downloaden

Rgnome

RGNome is een op GTK gebaseerde frontend voor GNU R, die een veelgebruikte taal is voor statistische computergebruik. ...

162

Downloaden