Jericho html parser

Een eenvoudige maar krachtige Java-bibliotheek die analyse en manipulatie van delen van een HTML-document mogelijk maakt.
Download nu

Jericho html parser Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • LGPL
  • Prijs:
  • FREE
  • Naam uitgever:
  • Martin Jericho
  • Uitgever website:

Jericho html parser Tags


Jericho html parser Beschrijving

Een eenvoudige maar krachtige Java-bibliotheek die analyse en manipulatie van delen van een HTML-document mogelijk maakt. JERICH HTML PARDER is een eenvoudige maar krachtige Java-bibliotheek die analyse en manipulatie van onderdelen van een HTML-document, inclusief enkele algemene server-side-tags mogelijk maakt, terwijl het verven van onderworpen is aan niet-herkende of ongeldige HTML. Het biedt ook HTML-formuleringsfuncties op hoog niveau .Jericho HTML PARSER-project is een open source-bibliotheek die wordt vrijgegeven onder de GNU Lesser General Public License (LGPL). U bent daarom vrij om het te gebruiken in commerciële toepassingen die onder de voorwaarden zijn gedetailleerd in het licentiedocument. Hier zijn enkele belangrijke kenmerken van "Jericho HTML PARDER": · Geen ontleedboom van het gehele document wordt ooit gegenereerd. De tekstbrontekst wordt alleen doorzocht voor de markup die relevant is voor de huidige operatie. Hierdoor kan de bibliotheek documenten analyseren en wijzigen die onjuiste of slecht geformatteerde HTML of een andere server- of client-zijcode, script, macro of markup zijn. De meeste andere parsers kunnen geen inhoud aan dat ze niet expliciet worden geprogrammeerd om te accepteren. · De begin- en eindposities in de brontekst van alle geparde segmenten zijn toegankelijk, waardoor alleen geselecteerde segmenten van het document kan worden gewijzigd zonder het volledige document uit een parse-boom te hoeven reconstrueren. Deze functie maakt de toolkit in combinatie met het apparaat extreem krachtig in zijn eenvoud. · Biedt een eenvoudige maar uitgebreide interface voor de analyse en manipulatie van HTML-formulierregelaars, inclusief de extractie en de populatie van initiële waarden en conversie naar alleen-lezen of gegevensweergavemodi. Analyse van de formulierregelaars maakt ook mogelijk dat gegevens die worden ontvangen van het formulier dat moet worden opgeslagen en gepresenteerd op een passende manier. · ASP-, JSP-, PSP-, PHP- en MASON SERVER-tags kunnen worden geregistreerd voor erkenning door de PARDER, en worden zo nauwkeurig erkend zoals mogelijk is zonder de werkelijke parsers voor deze talen in de bibliotheek te integreren. De bibliotheek maakt vervolgens een van deze segmenten toe om te worden genegeerd bij het parseren van de rest van het document, zodat ze de HTML-syntaxis niet verstoren. (zie segment.ignorewhenpars ()) · Types van aangepaste tag kunnen eenvoudig worden gedefinieerd en geregistreerd voor erkenning door de parser. Wat is er nieuw in deze release: Bugfixes: · Infinite Loop op segment.getallstartTags () · Infinite Loop op segment.getallellements () · Segment.getFirst * Methoden geretourneerde segmenten buiten het grenzendegment. · Segment.getallellements methoden hebben in sommige omstandigheden niet alle ingesloten elementen teruggebracht. · Vaste documentatiefouten in segment.getallelements methoden. · Toegevoegde streamedSource-klasse. Wijzigingen die het gedrag van bestaande programma's kunnen beïnvloeden: · Gewijzigd Parsetext van klasse tot interface. · Segment.GetNodeiterator () retourneert nu karakterreferenties als afzonderlijke knooppunten. · Toegevoegde tag-zoekmethoden op basis van reguliere expressies van attribuutwaarde. · Toegevoegde tag-zoekmethoden op basis van HTML-classattribuut. · Toegevoegde statische bron.legmaynodeiteratorCompatabilityMode-eigenschap Tijdelijk om segment.getnodeiterator () -functionaliteit naar die van eerdere versies te herstellen. · Verwijderde Char [] -gebaseerde zoekmethoden in ParSETEXT. · Toegevoegde tekenrefference.appsharto (bijlage). · Toegevoegd uitgangsdocument (segment) constructor. · Toegevoegde streamedsourcecopy-voorbeeldprogramma.


Jericho html parser Gerelateerde software

Mini-XML

Mini-XML is een kleine XML-parserende bibliotheek die u kunt gebruiken om XML- en XML-achtige gegevensbestanden te lezen. ...

158

Downloaden

Jabref

Jabref is een grafische Java-applicatie voor het beheren van BIBTEX (. BIB) -databases. ...

325

Downloaden