UTF8

PERL PRAGMA om UTF-8 (of UTF-EBCDIC) in de broncode in te schakelen
Download nu

UTF8 Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Perl Artistic License
  • Prijs:
  • FREE
  • Naam uitgever:
  • TTY Internet Solutions
  • Uitgever website:
  • http://search.cpan.org/~tty/

UTF8 Tags


UTF8 Beschrijving

Perl Pragma om UTF-8 (of UTF-EBCDIC) in de broncode in / uit te schakelen UTF8 is een PERL-klasse om UTF-8 (of UTF-EBCDIC) in de broncode te gebruiken. Synopsis Gebruik UTF8; geen UTF8; # Converteer een perl-scalar naar / van OTF-8. $ num_octets = UTF8 :: upgrade ($ string); $ succes = utf8 :: downgrade ($ string ); # Verander de native bytes van een perl-scalar van / van UTF-8 bytes. UTF8 :: CODE ($ string); UTF8 :: Decode ($ string); $ vlag = UTF8 :: Geldig (string); het gebruik UTF8 Pragma vertelt de PERL PARDER om UTF-8 in de programmeertekst in de huidige lexicale scope toe te staan (UTF-EBCDIC op EBCDIC-gebaseerde platforms toestaan). De NO UTF8 Pragma vertelt Perl om terug te schakelen naar de behandeling van de brontekst als letterlijke bytes in de huidige lexicale scope. Gebruik dit pragma niet voor al het andere dan het vertellen van Perl dat uw script is geschreven in UTF-8. De hieronder beschreven hulpprogramma's zijn rechtstreeks bruikbaar zonder gebruik UTF8;. Omdat het niet mogelijk is om op betrouwbare wijze UTF-8 te vertellen tegen inheemse 8-bits -coderingen, heeft u een byte-ordermarkering nodig aan het begin van uw broncode of utf8; Om Perl te instrueren.Wanneer UTF-8 het standaard bronformaat wordt, wordt dit pragma effectief een no-op. Voor het gemak in wat volgt de term UTF-X wordt gebruikt om te verwijzen naar UTF-8 op ASCII- en ISO Latin-gebaseerde platforms en UTF-EBCDIC op EBCDIC gebaseerde platforms.See ook de effecten van de -c-schakelaar en zijn neef, de $ env {PERL_UNICODE}, in Perlrun.enabling De UTF8 Pragma heeft het volgende effect: * bytes in de brontekst die hun hoogste set hebben, wordt behandeld als een deel van een letterlijke UTF-X-sequentie. Dit omvat de meeste literalen zoals identificatienamen, stringconstanten en constante reguliere expressiepatronen. Op EBCDIC-platforms worden tekens in de Latijnse 1-tekenset behandeld als onderdeel van een letterlijk UTF-EBCDIC-personage.note dat als u bytes hebt met de achtste bit in uw script (bijvoorbeeld ingebedde Latin-1 in uw string-literatuur), Gebruik UTF8 zal niet tevreden zijn, omdat de bytes hoogstwaarschijnlijk niet goed gevormd UTF-X zijn. Als u zulke bytes gebruikt UTF8, kunt u dit pragma uitschakelen tot het einde van het blok (of het bestand, indien op het hoogste niveau) met NO UTF8;. Vereisten: · Perl


UTF8 Gerelateerde software