Unicode :: Kaart8

Unicode :: Kaart8 is een toewijzingstabel tussen 8-bits tekens en unicode.
Download nu

Unicode :: Kaart8 Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Perl Artistic License
  • Prijs:
  • FREE
  • Naam uitgever:
  • Gisle Aas
  • Uitgever website:
  • http://search.cpan.org/~gaas/

Unicode :: Kaart8 Tags


Unicode :: Kaart8 Beschrijving

Unicode :: Kaart8 is een toewijzingstabel tussen 8-bits tekens en Unicode. Unicode :: Kaart8 is een kaartje tussen 8-bits tekens en Unicode.Synopsis vereist Unicode :: Kaart8; Mijn $ NO_MAP = Unicode :: Kaart8-> NIEUW ("ISO646-NO") || dood gaan; Mijn $ L1_MAP = Unicode :: Kaart8-> Nieuw ("Latin1") || dood gaan; mijn $ ustr = no_map-> tot16 ("v} re norske Tegn b | r {resn"); mijn $ lstr = $ l1_map-> to8 ($ ustr); Print $ lstr; Print $ NO_MAP-> TOU ("V} re norske Tegn b | r {resn") -> UTF8De Unicode :: Kaart8 Klasse implementeren Efficiënte kaarttabellen tussen 8-bits tekensets en 16 bit tekensets zoals Unicode. De tabellen zijn efficiënt, zowel in termen van toegewezen ruimte die is toegewezen als de vertaalsnelheid. De 16-bits strings wordt verondersteld om Network Byte-bestelling te gebruiken. De volgende methoden zijn beschikbaar: $ M = Unicode :: MAP8-> NIEUW () Het object Constructor creëert nieuwe instanties van de Unicode :: Kaart8-klasse. Ik neemt een optioneel argument dat specificeert en de naam van een 8-bits tekenset om toewijzingen van te initialiseren. Het argument kan ook een naam van een kaartbestand zijn. Als de CharsSet / -bestand niet kan worden gevonden, retourneert de constructor undef.if. Als u het argument weglaat, is een lege toewijzingstabel geconstrueerd. U moet vervolgens toewijzing van paren toevoegen met behulp van de hieronder beschreven methode AddPair (). $ M-> AddPair ($ U8, $ U16); voegt een nieuw mapping-paar toe aan het mapping-object. Het kost twee argumenten. De eerste is de codewaarde in de 8-bits tekenset en de tweede is de overeenkomstige codewaarde in de 16-bits tekenset. Dezelfde codes kunnen meerdere keren worden gebruikt (maar met hetzelfde paar heeft geen effect). De eerste definitie voor een code is degene die wordt gebruikt. Raad voor het volgende voorbeeld: $ M-> AddPair (0x20, 0x0020); $ M-> AddPair (0x20, 0x00A0); $ M-> AddPair (0xa0, 0x00A0); het betekent dat het personage 0x20 en 0xa0 in de 8-bits charsetkaarten op zichzelf in de 16-bits set, maar in de 16-bits tekenset 0x0A0-kaarten naar 0x20. $ m. $ m -> Standaard_to8 ($ U8) Stel de code van het standaardkarakter in om te gebruiken bij het toewijzen van 16-bits tot 8-bits snaren. Als er geen toewijzingspaar is gedefinieerd voor een teken, wordt deze standaard gesubstitueerd met TO8 () en RecoDE8 (). $ M-> Default_TO16 ($ U16) Stel de code van het standaardkarakter in om te gebruiken bij het toewijzen van 8-bit naar 16 -bit snaren. Als er geen mappingpaar is gedefinieerd voor een teken, wordt deze standaard gebruikt door TO 16 (), TOU () en RecoDE8 (). $ M-> Nostrict; alle undefined-toewijzingen worden vervangen door de identiteitsmapping. Ongedefinieerde teken wordt normaal gesproken uitgevoerd (of vervangen door de standaardinstelling indien gedefinieerd) bij het converteren tussen tekensets. $ M-> TO8 ($ USTR); converteert een 16-bits tekenreeks naar de overeenkomstige tekenreeks in de 8-bits tekenset. $ M-> To16 ($ Str); converteert een 8-bits tekenreeks naar de corresponderende reeks in de 16-bits tekenset. $ M-> TOU ($ STR); hetzelfde en 16 () maar retourneer een Unicode :: String-object in plaats van een gewone UCS2-string. $ M-> RecoDE8 ($ m2, $ str); Kaart de snaar $ str van een 8-bits tekenset ($ m) naar een andere ($ m2). Omdat we ervan uitgaan dat we de toewijzing van de gemeenschappelijke 16-bitcodering kennen, kunnen we dit gebruiken om te converteren tussen een van de 8-bits tekensets. $ M-> To_Char16 ($ U8) Kaart een enkele 8-bits karaktercode aan een 16 -bitcode. Als het 8-bits karakter niet is gemonteerd, wordt de constante nochar geretourneerd. De standaardinstelling wordt niet gebruikt en de callback-methode wordt niet ingeroepen. $ M-> To_char8 ($ U16) Kaart een enkele 16-bits karaktercode naar een 8-bits code. Als het 16-bits karakter niet is gemonteerd, wordt de constante nochar geretourneerd. De standaard wordt niet gebruikt en de callback-methode wordt niet aangeroepen. De volgende callback-methoden zijn beschikbaar. U kunt deze methoden overschrijven door een subklasse van Unicode te maken :: Kaart8. $ M-> Unmapped_to8Wanneer het in kaart brengen van 8-bits tekenreeks en er is geen mapping gedefinieerd (en geen standaard), dan wordt deze methode als het laatste resort genoemd. Het wordt geroepen met een enkel geheel getal-argument dat de code is van het ongehinderde 16-bits karakter. Naar verwachting zal het een tekenreeks retourneren dat zal worden opgenomen in de 8-bits string. De standaardversie van deze methode retourneert altijd een lege string.EXAMPLE: PAKKET MYMAPPER; @ ISA = QW (Unicode :: Kaart8); sub unmapped_to8 {mijn ($ zelf, $ code) = @_; vereisen Unicode :: Charname; ""; } $ m-> unmapped_to16lik in het toewijzen van een tekenreeks van 16-bits en er wordt geen toewijzing gedefinieerd, deze methode wordt genoemd. Het moet een 16-bits string retourneren met de bytes in netwerkbyte-bestelling. De standaardversie van deze methode retourneert altijd een lege tekenreeks. Vereisten: · Perl


Unicode :: Kaart8 Gerelateerde software

Mamory

MAMORY is een bibliotheek voor ROM-beheer in emulator-gerelateerde projecten. ...

158

Downloaden

Neem

NEEM is een bibliotheek die een implementatie van epidemische multicast biedt. ...

148

Downloaden