| raster Grammatica-gebaseerde reconstructie van informatie-dichte datatabellen |
Download nu |
raster Rangschikking & Samenvatting
- Vergunning:
- MIT/X Consortium Lic...
- Naam uitgever:
- Marco D. Adelfio
- Uitgever website:
- https://github.com/madelfio/
raster Tags
raster Beschrijving
GRIDD is een Python-bibliotheek voor het extraheren van schema-informatie van databellen.Sample Usagebuse GRIDD om gegevens uit een tabel in XLS- of HTML-indeling uit te halen en deze standaard uit te voeren (als CSV-standaard).> Gradd Extract File.XLSCategory, Country, Residents, Toepassingen , Verenigde Staten, 30700700.224912North Amerika, Canada, 33739900,5067north Amerika, Mexico, 112033369.230801Asia, Japan, 127557958,295315Asia, China, 133138000000.229096Asia, Zuid-Korea, 48747000,127316You kan uw uitvoerformaat kiezen (JSON biedt meer schema info):> Gridd Extract -o JSON FILE.XLSOR Vraag om meer uitgebreide output:> Gridd Extract-V-bestand.XLSSEVERALE-extractiemethoden zijn ingebouwd. Standaard wordt de PARDER-methode gebruikt, maar de Bayes- en WebTables-methoden zijn beschikbaar. Ondersteuning voor aanvullende methoden is gepland.> Gridd Extract -M-m Webtables Bestand.xlsuse vooraf gedefinieerde externe sets van waarden om de extractienauwkeurigheid te verbeteren.> GRIDD Extract-sets bestand.xlstrain De raster-classificator met behulp van aangepaste annotaties.> Gradd Train -a Annotaties .txt file1.xls file2.xls file3.xls ... succesvol getraind met 3 bestanden.model parameters die zijn opgeslagen in training.jsonrun een webinterface die zowel de onbewerkte gegevenstabel als de geëxtraheerde gegevenstabel weergeeft.> GRIDD Web File.xls * Running op http://0.0.0.0:5000/PRODUCT's startpagina
raster Gerelateerde software