Inversion des codages des caractères UTF-8 et ASCII

Cette page encodée en Unicode (charset=UTF-8) a été mal interprétée par le navigateur en charset=ISO-8859-16: Roumain (ISO-8859-16).
Unicode Latin+ | Unicode Chinois | GBK | Idéogrammes | ASCII | Table ASCII | ASCII => UTF-8 | UTF-8 => ASCII
Affichage du caractĂšre Ă©
Mnémonique
Cause d'Erreur
é
UTF-8 => ASCII
Page stockée en fichier local en format Unicode UTF-8 interprétée par erreur en ASCII
ASCII => UTF-8
Page stockée en fichier local en format ASCII interprétée par erreur en Unicode UTF-8

Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.

Essayez le caractère é Unicode: il est doublé en é

Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.

   

Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrĂ© vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.

En rÚgle générale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur à l'affichage, le diamant point d'interrogation ou carré vide � apparaßt.

Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrĂ© vide �.

Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.

Il est utile de prĂ©ciser que tous les caractĂšres ASCII du code 0 Ă  127 gardent toujours les mĂȘmes codes sans changement quelque soit le codage des caractĂšres, ASCII, GBK, Unicode...

Tous les caractĂšres ASCII Ă©tendus du code 0 Ă  255 (2**8=256, uni-octet, mono-byte) peuvent ĂȘtre stockĂ©s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractĂšres multi-octet (multi-byte) avec un code supĂ©rieur ou Ă©gal Ă  256, qui ne peuvent ĂȘtre conservĂ©s que dans un fichier Unicode comme UTF-8, ou bien dans un format spĂ©cifique (code page pays) tel le GBK pour les idĂ©ogrammes chinois.

Sur le web, un caractĂšre Unicode peut en outre s'exprimer en code entitĂ© HTML, ainsi stockĂ© dans un fichier du codage ASCII. Par exemple, l'idĂ©ogramme èŻ­ signifiant Langue, peut ĂȘtre stockĂ© en mode ASCII par la chaĂźne 语, composĂ©e uniquement des ampersand &, diĂšse #, suivi par des chiffres du numĂ©ro dĂ©cimal de ce caractĂšre en Unicode, et terminĂ© par un point-virgule ;.

Citation de Mao pour tester:

äž­ć›œćș”ćŻčäșș类䜜ć‡șèŸƒć€§çš„èŽĄçŒźïŒ

La Chine doit faire une contribution relativement grande à l'Humanité !

ويŰȘŰčين Űčلى Ű§Ù„Ű”ÙŠÙ† ŰȘÙ‚ŰŻÙŠÙ… Ű§ŰłÙ‡Ű§Ù…Ű§ŰȘ Ű§ÙƒŰšŰ± Ù„Ù„ŰšŰŽŰ±ÙŠŰ©!

КотаĐč ĐŽĐŸĐ»Đ¶Đ”Đœ ŃĐŽĐ”Đ»Đ°Ń‚ŃŒ Đ±ĐŸĐ»ŃŒŃˆĐžĐč ĐČĐșлаЎ ĐČ Ń‡Đ”Đ»ĐŸĐČДчДстĐČĐŸ!

ÎšÎŻÎœÎ± Ξα πρέπΔÎč Μα συΌÎČΏλΔÎč πΔρÎčÏƒÏƒÏŒÏ„Î”ÏÎż στηΜ αΜΞρωπότητα!

äž­ć›œăŻäșșéĄžă«ć€§ăăȘèČąçŒźă‚’ă—ăŠăă ă•ă„ïŒ

Ś‘ŚĄŚ™ŚŸ ڙک ŚȘŚšŚ•ŚžŚ” Ś’Ś“Ś•ŚœŚ” ŚœŚŚ Ś•Ś©Ś•ŚȘ!

à€šà„€à€š à€źà€Ÿà€šà€” à€œà€Ÿà€€à€ż à€•à„‡ à€Čà€żà€ à€à€• à€Źà€Ąà€Œà€Ÿ à€Żà„‹à€—à€Šà€Ÿà€š à€•à€°à€šà€Ÿ à€šà€Ÿà€čà€żà€!

àžˆàž”àž™àž„àž§àžŁàžˆàž°àčƒàž«àč‰àžĄàž”àžȘàčˆàž§àž™àžŁàčˆàž§àžĄàžĄàžČàžàž‚àž¶àč‰àž™àč€àžžàž·àčˆàž­àžĄàž™àžžàž©àžąàžŠàžČàž•àžŽ!

چین ŰšŰ§ÛŒŰŻ ŰłÙ‡Ù… ŰšÛŒŰŽŰȘŰ±ÛŒ ŰšÙ‡ Ű§Ù†ŰłŰ§Ù† ۱ۧ!

China shall make a relatively great contribution to the Man Kind!

Cette page est stockĂ©e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffĂ©rents codages. Elle peut devenir illisible si le codage diffĂšre trop. Il faut revenir en UTF-8 si vous avez mal Ă  la tĂȘte. Testez vous-mĂȘme sur votre navigateur en cliquant sur les liens suivants:

[Détection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois Simplifié (GB18030) | Chinois Simplifié (GB2312) | Chinois Simplifié (GBK) | Chinois Simplifié (HZ) | Chinois Traditionnel (Big5) | Coréen (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | Hébreu (Windows-1255) | Hébreu (ISO-8859-8) | Hébreu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | Thaï (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).

Unicode Latin+ | Unicode Chinois | GBK | Idéogrammes | ASCII | Table ASCII | ASCII => UTF-8 | UTF-8 => ASCII
jinMonnaies | zhongHorloge | yiTraduction | ciDictionnaires | xieEcrire | zhuanEncoder

Envoyez vos commentaires (1)

1. Visiteur *.*.182.* - 2015-10-19 10:04:52
ويŰȘŰčين Űčلى Ű§Ù„Ű”ÙŠÙ† ŰȘÙ‚ŰŻÙŠÙ… Ű§ŰłÙ‡Ű§Ù…Ű§ŰȘ Ű§ÙƒŰšŰ± Ù„Ù„ŰšŰŽŰ±ÙŠŰ©!
Email Web

Veuillez recopier la chaĂźne :
Texte Ă  recopier.

Chaussures Chinoises > Inversion des codages des caractères UTF-8 et ASCII
  
FenĂȘtre contextuelle    Fermer
Veuillez patienter...