| J4L OCR-gereedschappen JAVA OCR-onderdelen Toolkit |
Download nu |
J4L OCR-gereedschappen Rangschikking & Samenvatting
- Naam uitgever:
- J4L Components
- Besturingssystemen:
- Windows All
J4L OCR-gereedschappen Tags
J4L OCR-gereedschappen Beschrijving
J4L OCR-tools is een krachtige set componenten die zijn ontworpen om OCR-mogelijkheden in Java-toepassingen op te nemen. Dat betekent dat u faxen of scan-documenten kunt ontvangen en bedrijfsinformatie uit de afbeeldingen kunt uitpakken. De belangrijkste 2 componenten zijn: · Een Java-wikkel voor de Tesseract OCR-motor. Het OCR-motor Tesseract zelf wordt geleverd onder de Apache 2.0-licentie en we ondersteunen een versie alleen voor Windows. · Een tekstdocument parser. Het beeldherkenningsproces kan daarom in 2 stappen worden verdeeld: · De component neemt een afbeeldingsbestand (TIF, PNG, JPG, enz.) En retourneert de tekst in deze. De Java Wrapper voert deze operatie uit met behulp van TESSERACT. Als alternatief kunt u elke andere OCR-motor gebruiken. · In de tweede stap moet uw Java-toepassing de tekst begrijpen die is geretourneerd door de OCR-motor. Dit gebeurt door de Document Parser. De Document Parser gebruikt als invoer als tekststring (de gegevens) en een XML-bestand dat de structuur van het document beschrijft en het ouput is een bedrijfsdocument als een Java-object of als een XML-bestand
J4L OCR-gereedschappen Gerelateerde software