| htmlcxx HTMLCXX is een eenvoudige niet-validerende CSS1- en HTML-parser voor C ++. |
Download nu |
htmlcxx Rangschikking & Samenvatting
- Naam uitgever:
- Davi de Castro Reis and Robson Braga Ara
htmlcxx Tags
htmlcxx Beschrijving
HTMLCXX is een eenvoudige niet-validerende CSS1- en HTML-parser voor C ++. HTMLCXX-project is een eenvoudige niet-validerende CSS1- en HTML-parser voor C ++. Hoewel er verschillende andere HTML-parsers beschikbaar zijn, heeft HTMLCXX enkele kenmerken die het uniek maken: · STL zoals navigatie van DOM-boom, met behulp van Excelent's Tree.hh-bibliotheek van Kasper Peeters · Het is mogelijk om precies te reproduceren, het karakter van het karakter, het originele document Vanuit de parsboom · gebundelde CSS-parser · Optionele parsering van attributen · C ++ -code die eruit ziet als C ++ (niet zo waar meer) · Offsets van tags / elementen in het originele document worden opgeslagen in de knooppunten van de DOM-boom de parserende politiek van HTMLCXX werden gecreëerd die proberen Mozilla Firefox (http://www.mozilla.org) gedrag te nabootsen. Dus je zou moeten verwachten dat parse bomen vergelijkbaar zijn met die creëren door Firefox. Anders dan Firefox, voegt HTMLCXX echter niet-bestaande dingen in uw HTML. Daarom geeft het serialiseren van de Dom Tree precies dezelfde bytes in de oorspronkelijke HTML-document. Excursies: het gebruik van HTMLCXX is vrij eenvoudig. Bekijk dit voorbeeld. #Include ... // PARSE Sommige HTML-code String HTML = "
HEY
"; Html :: parserdom parser; BOOM DOM = PARDERER.PARSETREE (HTML); // Print Whole Dom Tree Cout :: iterator einde = dom.d (); voor (; het! = einde; ++ it) {if (it-> tagname () == "a") {it-> parseattributes (); Cout-kenmerken ("HREF"); }} // dump alle tekst van het document IT = DOM.BEGIN (); einde = dom.d (); voor (; het! = einde; ++ it) {if ((! it-> istag ()) (! it-> iscommentment ()) {cout tekst (); }} Wat is er nieuw in deze release: · Compilatie-fixes voor GCC 4.3.
htmlcxx Gerelateerde software