HTML Agility Pack

Een Agile HTML-parser die een lees / schrijf DOM bouwt en ondersteunt Plain XPath of XSLT
Download nu

HTML Agility Pack Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Naam uitgever:
  • Darth Obiwan
  • Besturingssystemen:
  • Windows All
  • Bestandsgrootte:
  • 126 KB

HTML Agility Pack Tags


HTML Agility Pack Beschrijving

HTML Agility Pack (HAP) is ontwikkeld om een Agile HTML-parser te zijn die een lees / schrijf-dom bouwt en het gewone XPath of XSLT ondersteunt. Het is een .NET-code-bibliotheek waarmee u "Out of the Web" HTML-bestanden kunt ontleden. De parser is erg tolerant met "echte wereld" misvormde HTML. Het objectmodel lijkt erg op wat System.xml voorstelt, maar voor HTML-documenten (of streams). HTML Agility Pack ondersteunt nu LINQ aan objecten (via een LINQ naar XML-achtige interface). Voorbeeldtoepassingen: - Pagina-fixatie of generatie. U kunt een pagina oplossen zoals u wilt, de DOM aanpassen, knooppunten toevoegen, knooppunten kopiëren, nou ... u noemt het. - Webscanners. U kunt eenvoudig bij IMG / SRC of A / Hrefs bereiken met een Bunch XPath-query's. - Webschrapers. U kunt eenvoudig een bestaande webpagina in een RSS-feed schraffen, bijvoorbeeld met slechts een XSLT-bestand dat als binding dient. Een voorbeeld hiervan wordt verstrekt. Er is geen afhankelijkheid van iets anders dan .NET's XPath-implementatie. Er is geen afhankelijkheid van het MSHTML DLL of W3C's HTML Tidy of ActiveX / COM-object van Internet Explorer, of zoiets. Er is ook geen therapietrouw aan XHTML of XML, hoewel u XML daadwerkelijk kunt produceren met behulp van de tool. De versie die hier op codeplex is geplaatst, is voor het .NET Framework 2.0. Als je de oude versie nodig hebt, ga dan naar de oude pagina of laat me een notitie vallen.


HTML Agility Pack Gerelateerde software