Html parserBibliotheek om HTML-inhoud te parseren | |
Download nu |
Html parser Rangschikking & Samenvatting
Advertentie
- Vergunning:
- LGPL
- Prijs:
- FREE
- Naam uitgever:
- Derrick Oswald
- Uitgever website:
- Besturingssystemen:
- Mac OS X
- Bestandsgrootte:
- 323 KB
Html parser Tags
Html parser Beschrijving
Bibliotheek om HTML-inhoud te parseren HTML PARDER is een gratis en open source Java-bibliotheek die wordt gebruikt om HTML te ontleden in een lineaire of geneste mode. Voornamelijk gebruikt voor transformatie of extractie, heeft HTML-functies, bezoekers, aangepaste tags en eenvoudig te gebruiken Javabeans. Het is een snel, robuust en goed geteste pakket.ExtractionExtractie omvat alle informatie-ophaalprogramma's die niet bedoeld zijn om de bronpagina te behouden. Deze covers gebruikt als: · Tekst-extractie, voor gebruik als invoer voor tekstzoekers-databases, bijvoorbeeld · Link-extractie, voor het kruipen door webpagina's of het oogsten van e-mailadresschralen, voor programmatische gegevensinvoer van webpagina's · Resource-extractie, het verzamelen van afbeeldingen of geluiden · Een browser-voorkant, de voorlopige fase van pagina-display · Linkcontrole, het garanderen van links zijn geldig · Site-monitoring, controle voor paginaverschillen die verder gaan dan simplistische diffsleer zijn verschillende faciliteiten in de HTMLPARSER-CODEBASE om te helpen met extractie, inclusief filters, bezoekers en Javabeans. TransformationTransformatie omvat alle verwerking waarbij de invoer en de uitvoer HTML-pagina's zijn. Enkele voorbeelden zijn: · URL herschrijven, sommige of alle links op een pagina wijzigen · Site Capture, het verplaatsen van inhoud van het web naar lokale schijf · Censuur, het verwijderen van beledigende woorden en zinsdelen van pagina's · HTML-opruiming, het corrigeren van foutieve pagina's ingenomen URL's verwijzen naar reclame · Conversie naar XML, bestaande webpagina's verplaatsen naar XML-vereisten: · Java Wat is er nieuw in deze release: · Het HTMLPARSER-project is bijgewerkt met een nieuwe licentie, nieuwbouwomgeving, nieuwe repository en een nieuwe website. Om deze radicale verandering te identificeren, is de versie ingetrokken naar 2.0. · In reactie op verzoeken van de Apache-community is het HTMLParser-licentie gewijzigd van GNU-bibliotheek of mindere General Public License, naar de meer Apache Friendly Common Public License 1.0 (http://opensource.org/licenses/cpl1.0.txt) . · De HTMLPARSER-repository is gewijzigd van CVS naar Subversion (http://subversion.tigris.org/). · Om automatische integratie in andere projecten te ondersteunen, is de bouwomgeving veranderd van mier naar Maven 2 (http://maven.apache.org/). Dit heeft een mogelijkheid gegeven om de website bij te werken (http://htmlparser.org).
Html parser Gerelateerde software
JVECTClipboard
Een bibliotheek voor cross-platform vectorafbeeldingen gesneden en plakken ...
48 96 KB