TESSERACT-OCR

OCR-motor die is ontwikkeld bij HP Labs tussen 1985 en 1995 en nu bij Google
Download nu

TESSERACT-OCR Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Naam uitgever:
  • theraysmith
  • Uitgever website:
  • Besturingssystemen:
  • Windows XP / Vista / 7
  • Bestandsgrootte:
  • 0 KB

TESSERACT-OCR Tags


TESSERACT-OCR Beschrijving

Edit van Tesseract is waarschijnlijk de meest accurate open source OCR-engine beschikbaar. In combinatie met de Leptonica Image Processing Library kan het een breed scala aan beeldformaten lezen en ze converteren naar tekst in meer dan 60 talen. Het was een van de top 3-motoren in 1995 UNLV Nauwkeurigheid test. Tussen 1995 en 2006 had weinig werk op, maar sindsdien is uitgebreid verbeterd door Google. Tesseract release notes 23 oktober 2012 - V3.02.02 - Verplaatst ResultIterator / PageIterator te ccmain. - Added rechts naar links / Bidi vermogen in de output iterators voor Hebreeuws / Arabisch. - Toegevoegde paragraaf detectie in de lay-out Analyse / post OCR. - Fixed inconsistent X-Hoogte tijdens de training en over-hakken. - Toegevoegd simultane multi-talen beschikbaar. - gerefactored top-level woordherkenning module. - Toegevoegd experimentele vergelijking detector. - verbeterde afhandeling van de resolutie van de oorspronkelijke beelden. - Blamer module toegevoegd foutanalyse. - opgeschoond uitwendig gebruik naamruimte verwijderen omvat van baseapi.h. - Verwijderde dode memory management-code. - opgeruimd beperkingen voor grenswaarden. - Ondersteuning toegevoegd voor ShapeTable in classifier en training. - gerefactored klasse snoeischaar. - Fixed training lekken en willekeur. - Belangrijke verbeteringen aan de lay-out-analyse voor beter imago detectie, diakritische detectie, beter tekstregel bevinding, beter tabstop bevinding. - Verbeterde line detectie en verwijdering. - Toegevoegd vaste toonhoogte Chopper voor CJK. - Added UNICHARSET te WERD_CHOICE om mult-taal hanteren gemakkelijker te maken. - Probleem opgelost met intern geschaalde afbeeldingen. - pagina toegevoegd en bbox string in tr bestanden naar de bron van een betere opleiding van de gegevens te identificeren. - Oplossingen Hindi Shiroreka splitter. - Toegevoegd woord bigram correctie. - Minder stack geheugengebruik en geëlimineerd een lelijke typedefs. - Toegevoegde nieuwe uniform classifier API. - Toegevoegde nieuwe training fout teller. - Fixed bug in endian dawg reader. - C API (met dank aan Tobias Müller) - Nieuwe oplossing voor VS 2008 (met dank aan Tom Powers) - En meer...


TESSERACT-OCR Gerelateerde software

Download SVN

Eenvoudig hulpprogramma dat het downloaden van Subversion (SVN) en GIT-repositories mogelijk maakt ...

237 9 KB

Downloaden