Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrÃĐ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En rÃĻgle gÃĐnÃĐrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur à l'affichage, le diamant point d'interrogation ou carrÃĐ vide � apparaÃŪt.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrÃĐ vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prÃĐciser que tous les caractÃĻres ASCII du code 0 à 127 gardent toujours les mÊmes codes sans changement quelque soit le codage des caractÃĻres, ASCII, GBK, Unicode...
Tous les caractÃĻres ASCII ÃĐtendus du code 0 à 255 (2**8=256, uni-octet, mono-byte) peuvent Être stockÃĐs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractÃĻres multi-octet (multi-byte) avec un code supÃĐrieur ou ÃĐgal à 256, qui ne peuvent Être conservÃĐs que dans un fichier Unicode comme UTF-8, ou bien dans un format spÃĐcifique (code page pays) tel le GBK pour les idÃĐogrammes chinois.
Sur le web, un caractÃĻre Unicode peut en outre s'exprimer en code entitÃĐ HTML, ainsi stockÃĐ dans un fichier du codage ASCII. Par exemple, l'idÃĐogramme čŊ signifiant Langue, peut Être stockÃĐ en mode ASCII par la chaÃŪne 语, composÃĐe uniquement des ampersand &, diÃĻse #, suivi par des chiffres du numÃĐro dÃĐcimal de ce caractÃĻre en Unicode, et terminÃĐ par un point-virgule ;.
äļå―åšåŊđäššįąŧä―åščūåΧįčīĄįŪïž
La Chine doit faire une contribution relativement grande à l'HumanitÃĐ !
ŲŲØŠØđŲŲ ØđŲŲ Ø§ŲØĩŲŲ ØŠŲØŊŲŲ Ø§ØģŲØ§Ų ا؊ Ø§ŲØĻØą ŲŲØĻØīØąŲØĐ!
ÐÐļŅаÐđ ÐīÐūÐŧÐķÐĩÐ― ŅÐīÐĩÐŧаŅŅ ÐąÐūÐŧŅŅÐļÐđ ÐēКÐŧаÐī Ðē ŅÐĩÐŧÐūÐēÐĩŅÐĩŅŅÐēÐū!
ÎÎŊÎ―Îą ÎļÎą ÏÏÎÏÎĩÎđ Î―Îą ÏÏ ÎžÎēÎŽÎŧÎĩÎđ ÏÎĩÏÎđÏÏÏÏÎĩÏÎŋ ÏÏÎ·Î― ÎąÎ―ÎļÏÏÏÏÏηÏÎą!
äļå―ãŊäššéĄãŦåΧããŠčēĒįŪãããĶãã ããïž
ŨŨĄŨŨ ŨŨĐ ŨŠŨĻŨŨŨ ŨŨŨŨŨ ŨŨŨ ŨŨĐŨŨŠ!
āĪāĨāĪĻ āĪŪāĪūāĪĻāĪĩ āĪāĪūāĪĪāĪŋ āĪāĨ āĪēāĪŋāĪ āĪāĪ āĪŽāĪĄāĪžāĪū āĪŊāĨāĪāĪĶāĪūāĪĻ āĪāΰāĪĻāĪū āĪāĪūāĪđāĪŋāĪ!
āļāļĩāļāļāļ§āļĢāļāļ°āđāļŦāđāļĄāļĩāļŠāđāļ§āļāļĢāđāļ§āļĄāļĄāļēāļāļāļķāđāļāđāļāļ·āđāļāļĄāļāļļāļĐāļĒāļāļēāļāļī!
ÚÛŲ ØĻØ§ÛØŊ ØģŲŲ ØĻÛØīØŠØąÛ ØĻŲ Ø§ŲØģØ§Ų ØąØ§!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockÃĐe dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffÃĐrents codages. Elle peut devenir illisible si le codage diffÃĻre trop. Il faut revenir en UTF-8 si vous avez mal à la tÊte. Testez vous-mÊme sur votre navigateur en cliquant sur les liens suivants:
[DÃĐtection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois SimplifiÃĐ (GB18030) | Chinois SimplifiÃĐ (GB2312) | Chinois SimplifiÃĐ (GBK) | Chinois SimplifiÃĐ (HZ) | Chinois Traditionnel (Big5) | CorÃĐen (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | HÃĐbreu (Windows-1255) | HÃĐbreu (ISO-8859-8) | HÃĐbreu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | ThaÃŊ (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).