Html parser

Bibliotheek om HTML-inhoud te parseren
Download nu

Html parser Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • LGPL
  • Prijs:
  • FREE
  • Naam uitgever:
  • Derrick Oswald
  • Uitgever website:
  • Besturingssystemen:
  • Mac OS X
  • Bestandsgrootte:
  • 323 KB

Html parser Tags


Html parser Beschrijving

Bibliotheek om HTML-inhoud te parseren HTML PARDER is een gratis en open source Java-bibliotheek die wordt gebruikt om HTML te ontleden in een lineaire of geneste mode. Voornamelijk gebruikt voor transformatie of extractie, heeft HTML-functies, bezoekers, aangepaste tags en eenvoudig te gebruiken Javabeans. Het is een snel, robuust en goed geteste pakket.ExtractionExtractie omvat alle informatie-ophaalprogramma's die niet bedoeld zijn om de bronpagina te behouden. Deze covers gebruikt als: · Tekst-extractie, voor gebruik als invoer voor tekstzoekers-databases, bijvoorbeeld · Link-extractie, voor het kruipen door webpagina's of het oogsten van e-mailadresschralen, voor programmatische gegevensinvoer van webpagina's · Resource-extractie, het verzamelen van afbeeldingen of geluiden · Een browser-voorkant, de voorlopige fase van pagina-display · Linkcontrole, het garanderen van links zijn geldig · Site-monitoring, controle voor paginaverschillen die verder gaan dan simplistische diffsleer zijn verschillende faciliteiten in de HTMLPARSER-CODEBASE om te helpen met extractie, inclusief filters, bezoekers en Javabeans. TransformationTransformatie omvat alle verwerking waarbij de invoer en de uitvoer HTML-pagina's zijn. Enkele voorbeelden zijn: · URL herschrijven, sommige of alle links op een pagina wijzigen · Site Capture, het verplaatsen van inhoud van het web naar lokale schijf · Censuur, het verwijderen van beledigende woorden en zinsdelen van pagina's · HTML-opruiming, het corrigeren van foutieve pagina's ingenomen URL's verwijzen naar reclame · Conversie naar XML, bestaande webpagina's verplaatsen naar XML-vereisten: · Java Wat is er nieuw in deze release: · Het HTMLPARSER-project is bijgewerkt met een nieuwe licentie, nieuwbouwomgeving, nieuwe repository en een nieuwe website. Om deze radicale verandering te identificeren, is de versie ingetrokken naar 2.0. · In reactie op verzoeken van de Apache-community is het HTMLParser-licentie gewijzigd van GNU-bibliotheek of mindere General Public License, naar de meer Apache Friendly Common Public License 1.0 (http://opensource.org/licenses/cpl1.0.txt) . · De HTMLPARSER-repository is gewijzigd van CVS naar Subversion (http://subversion.tigris.org/). · Om automatische integratie in andere projecten te ondersteunen, is de bouwomgeving veranderd van mier naar Maven 2 (http://maven.apache.org/). Dit heeft een mogelijkheid gegeven om de website bij te werken (http://htmlparser.org).


Html parser Gerelateerde software

Juk

Java-bibliotheek voor het compileren en executies van Java Expressions ...

151 637 KB

Downloaden