DOMSAX

DOMSAX is een implementatie van een XML-PARDER op basis van het standaarddocumentobject Model-principe.
Download nu

DOMSAX Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • LGPL
  • Prijs:
  • FREE
  • Naam uitgever:
  • Richard A.
  • Uitgever website:
  • http://gbic.biol.rug.nl/~rscheltema/domsax/

DOMSAX Tags


DOMSAX Beschrijving

DOMSAX is een implementatie van een XML-PARDER op basis van het standaarddocumentobject Model Principle. DOMSAX is een implementatie van een XML-PARDER op basis van het standaarddocumentobject Model Principle (en de implementatie van de zon), die het combineert met de flexibiliteit en de mogelijkheid van een laag geheugenverbruik van de SAX-PARDER (ook de implementatie van de zon op het feit dat de meeste XML- Documenten bevatten herhalende blokken (bijvoorbeeld dezelfde structuur van steeds opnieuw herhaald), de parser creëert voor elk herhaalblok een compleet document (met de documentwortel is het startelement van het herhalende blok). Dit maakt het mogelijk om de programmeur in staat te stellen De Code Clean en het geheugenverbruik binnen de grenzen. De parser is getest op Java 1.5.1. Voor parseren XML-bestanden zijn er momenteel twee opties: Sax en Dom. Met Sax krijg je de flexibiliteit om specifieke elementen uit een stroom te laden, Het minimaliseren van het geheugenconsumptie, maar complicerende zoekopdrachten en afnemende laadtijd. Met DOM krijgt u de mooie interface voor het zoeken van elementen in het volledig geladen document, maar deze interface wordt geleverd met een hoge C OST in geheugenconsumptie en lage snelheid.Wanneer ik met dit project begon, was een van de eisen de mogelijkheid om XML-bestanden van 100+ MB te verwerken. Dit liet me effectief alleen de keuze van Sax, waarmee het bestandselement voor het element kan worden geparseerd en me in staat stelt om het geheugenverbruik binnen de grenzen te houden. Ik vond echter niet de implicaties op de code voor het project. Iedereen die ooit een parser met SAX heeft gemaakt, zal het ermee eens zijn dat je met een puinhoop bent, vanwege de scheiding van het ontvangen van de open-tag, gegevens en close-tag. Dus wat ik wilde was de flexibiliteit van de Sax Parser gecombineerd met de Gebruiksgemak van de DOM-aanpak. Het onderliggende principe van DOMSAX is herhalende blokken, die kunnen worden aangegeven met de bestaande XPath-technologie. De meeste XML-bestanden slaan records, die altijd op dezelfde manier worden beschreven (bijv. Herhaalbare blokken). In het onderstaande voorbeeld is er een enkele koptekst, wat altijd het eerste element is binnen de document-root-tag (blauwe doos). Na de kop de elementen volgen (oranje dozen). Voor elk van de dozen aangegeven aan de parser met een XPath wordt een compleet document aangemaakt, met alleen de gegevens in het vak. Nadat het document is voltooid, wordt het doorgegeven aan de geregistreerde luisteraars.


DOMSAX Gerelateerde software

lof

LMAKER is een PHP-klasse die is ontworpen voor webmeesters en programmeurs die een eenvoudige manier willen genereren om websites te genereren. ...

136

Downloaden

Lipi Toolkit

Lipi Toolkit is een generieke toolkit voor online handschriftherkenning (HWR) en bevat gereedschappen en algoritmen voor HWR. ...

471

Downloaden