Tekst :: UnideCode

Tekst: UnideCode is een US-ASCII-transliteraties van Unicode-tekst.
Download nu

Tekst :: UnideCode Rangschikking & Samenvatting

Advertentie

  • Rating:
  • Vergunning:
  • Perl Artistic License
  • Prijs:
  • FREE
  • Naam uitgever:
  • Sean M. Burke
  • Uitgever website:
  • http://search.cpan.org/~sburke/

Tekst :: UnideCode Tags


Tekst :: UnideCode Beschrijving

Tekst :: UnideCode is een US-ASCII-transliteraties van Unicode-tekst. Tekst :: UnideCode is een US-ASCII-transliteraties van Unicode Text.Synopsis Gebruik UTF8; Gebruik tekst: UnideCode; Afdrukken Unidecode ("x {5317} x {4EB0} n" # dat zijn de Chinese karakters voor Beijing); # Die prints: Bei Jingit gebeurt vaak dat je niet-Romeinse tekstgegevens in Unicode hebt, maar je kunt het niet laten zien - meestal omdat je het probeert aan een gebruiker te tonen via een applicatie die Unicode niet ondersteunt, of omdat de lettertypen die u nodig hebt niet toegankelijk zijn. Je zou de Unicode-tekens kunnen vertegenwoordigen als "???????" of "15BA15A01610 ...", maar dat is bijna nutteloos voor de gebruiker die daadwerkelijk wil lezen wat de tekst zegt. Wat tekst :: UnideCode biedt is een functie, Unidecode (...) die Unicode-gegevens nodig heeft en probeert het te vertegenwoordigen In US-ASCII-tekens (dwz, de universeel weergegeven tekens tussen 0x00 en 0x7f). De weergave is bijna altijd een poging tot transliteratie - d.w.z., het overbrengen, in Romeinse brieven, de uitspraak uitgedrukt door de tekst in een ander schrijfsysteem. (Zie het voorbeeld in de synopsis.) De mogelijkheid van Unidecode om te translitereren wordt beperkt door twee factoren: · Het bedrag en de kwaliteit van gegevens in de Original Als u Hebreeuwse gegevens hebt die er geen klinkerpunten in hebben, kan Unidecode niet raden welke klinkers niet kunnen worden weergegeven in een uitspraak. S f y hv n vwls n th npt, y w ny ny vwls n th tpt. (Dit is een specifieke toepassing van het algemene principe van "afval in, vuilnis".) · Basisbeperkingen in de UnideCode Designwriting Een echt en slim transliteratie-algoritme voor elke enkele taal vereist meestal veel tijd, en ten minste een redelijke kennis van de betrokken taal. Maar Unicode-tekst kan meer talen overbrengen dan ik kan leren (veel minder een transferator voor) in de hele rest van mijn leven. Dus ik heb een dop opgelegd op de intelligente unidecode zou kunnen zijn, door aan te dringen dat het alleen context-ongevoelige transliteratie ondersteunt. Dat betekent het missen van de fijnere details van een bepaald schrijfsysteem, terwijl hij nog steeds hopelijk nuttig is.Unidecode, met andere woorden, is snel en vies. Soms is de output helemaal niet zo vies: Russisch en Grieks lijken passeerbaar te werken; En terwijl Thaana (Divehi, aka Maldivian) een absoluut niet-westerse schrijfsysteem is, lijkt het opzetten van een kaartje van het naar Romeinse letters vrij goed te werken. Maar soms is de output erg vies: Unidecode doet heel erg slecht op Japans en Thais. Als je een slimmere transliteratie voor een bepaalde taal wilt dan Unidecode biedt, dan moet je naar (of schrijven) een transferie-algoritme specifiek voor die taal zoeken, en het in plaats van (of tenminste vóór) de unidecode toe te passen. In andere woorden, de aanpak van Unidecode is breed (wetende van tientallen schrijfsystemen), maar ondiep (niet nauwgezet over een van hen). Vereisten: · Perl


Tekst :: UnideCode Gerelateerde software