Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrц╘ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En rц╗gle gц╘nц╘rale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur ц═ l'affichage, le diamant point d'interrogation ou carrц╘ vide � apparaцўt.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrц╘ vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prц╘ciser que tous les caractц╗res ASCII du code 0 ц═ 127 gardent toujours les mц╙mes codes sans changement quelque soit le codage des caractц╗res, ASCII, GBK, Unicode...
Tous les caractц╗res ASCII ц╘tendus du code 0 ц═ 255 (2**8=256, uni-octet, mono-byte) peuvent ц╙tre stockц╘s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractц╗res multi-octet (multi-byte) avec un code supц╘rieur ou ц╘gal ц═ 256, qui ne peuvent ц╙tre conservц╘s que dans un fichier Unicode comme UTF-8, ou bien dans un format spц╘cifique (code page pays) tel le GBK pour les idц╘ogrammes chinois.
Sur le web, un caractц╗re Unicode peut en outre s'exprimer en code entitц╘ HTML, ainsi stockц╘ dans un fichier du codage ASCII. Par exemple, l'idц╘ogramme Х╞ґ signifiant Langue, peut ц╙tre stockц╘ en mode ASCII par la chaцўne 语, composц╘e uniquement des ampersand &, diц╗se #, suivi par des chiffres du numц╘ro dц╘cimal de ce caractц╗re en Unicode, et terminц╘ par un point-virgule ;.
Д╦ґЕ⌡ҐЕ╨■Е╞╧Д╨╨Г╠╩ДҐ°Е┤╨ХЎ┐ЕєїГ └ХЄ║Г▄ўО╪│
La Chine doit faire une contribution relativement grande ц═ l'Humanitц╘ !
ы┬ы┼ь╙ь╧ы┼ы├ ь╧ы└ы┴ ьїы└ь╣ы┼ы├ ь╙ы┌ь╞ы┼ы┘ ьїьЁы┤ьїы┘ьїь╙ ьїы┐ь╗ь╠ ы└ы└ь╗ьЄь╠ы┼ь╘!
п п╦я┌п╟п╧ пЄпЎп╩пІп╣пҐ я│пЄп╣п╩п╟я┌я▄ п╠пЎп╩я▄я┬п╦п╧ п╡п╨п╩п╟пЄ п╡ я┤п╣п╩пЎп╡п╣я┤п╣я│я┌п╡пЎ!
н н╞нҐн╠ н╦н╠ о─о│нґо─н╣н╧ нҐн╠ о┐о┘н╪н╡н╛н╩н╣н╧ о─н╣о│н╧о┐о┐о▄о└н╣о│н© о┐о└нЇнҐ н╠нҐн╦о│о┴о─о▄о└нЇо└н╠!
Д╦ґЕ⌡ҐЦ│╞Д╨╨И║·Ц│╚ЕєїЦ│█Ц│╙Х╡╒Г▄ўЦ┌▓Ц│≈Ц│іЦ│▐Ц│═Ц│∙Ц│└О╪│
в▒в║в≥в÷ в≥в╘ в╙в╗в∙в·в■ в▓в⌠в∙в°в■ в°в░в═в∙в╘в∙в╙!
Ює Ю╔─Ює╗ ЮєўЮєЎЮє╗Ює╣ Ює°ЮєЎЮєєЮє© Ює∙Ю╔┤ Ює╡Ює©Ює▐ Ює▐Ює∙ Ює╛Ює║Ює╪ЮєЎ Ює╞Ю╔▀Ює≈ЮєіЮєЎЮє╗ Ює∙Ює╟Ює╗ЮєЎ Ює ЮєЎЮє╧Ює©Ює▐!
Ю╦┬Ю╦╣Ю╦≥Ю╦└Ю╦їЮ╦ёЮ╦┬Ю╦╟Ю╧┐Ю╦╚Ю╧┴Ю╦║Ю╦╣Ю╦╙Ю╧┬Ю╦їЮ╦≥Ю╦ёЮ╧┬Ю╦їЮ╦║Ю╦║Ю╦╡Ю╦│Ю╦┌Ю╦ІЮ╧┴Ю╦≥Ю╧─Ю╦·Ю╦ЇЮ╧┬Ю╦ґЮ╦║Ю╦≥Ю╦╦Ю╦╘Ю╦╒Ю╦┼Ю╦╡Ю╦∙Ю╦Є!
з├ш▄ы├ ь╗ьїш▄ь╞ ьЁы┤ы┘ ь╗ш▄ьЄь╙ь╠ш▄ ь╗ы┤ ьїы├ьЁьїы├ ь╠ьї!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockц╘e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffц╘rents codages. Elle peut devenir illisible si le codage diffц╗re trop. Il faut revenir en UTF-8 si vous avez mal ц═ la tц╙te. Testez vous-mц╙me sur votre navigateur en cliquant sur les liens suivants:
[Dц╘tection Auto] (auto) | Arabe (ISO-8859-6) | Arabe (Windows-1256) | ASCII Europe Occidentale (ISO-8859-1) | ASCII Europe Occidentale (Windows-1252) | Baltique (ISO-8859-4) | Baltique (Windows-1257) | Celtique (ISO-8859-14) | Chinois Simplifiц╘ (GB18030) | Chinois Simplifiц╘ (GB2312) | Chinois Simplifiц╘ (GBK) | Chinois Simplifiц╘ (HZ) | Chinois Traditionnel (Big5) | Corц╘en (EUC-KR) | Cyrillique (ISO-8859-5) | Cyrillique (KOI8-R) | Cyrillique (KOI8-U) | Cyrillique (Windows-1251) | Estonien (ISO-8859-13) | Europe Centrale (ISO-8859-2) | Europe Centrale (Windows-1250) | Europe Sud (ISO-8859-3) | Grec (ISO-8859-7) | Grec (Windows-1253) | Hц╘breu (Windows-1255) | Hц╘breu (ISO-8859-8) | Hц╘breu (ISO-8859-8-l) | Japonais (EUC-JP) | Japonais (ISO-2022-JP) | Japonais (Shift_JIS) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | Thaц╞ (TIS-620) | Turc (ISO-8859-9) | Turc (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamien (Windows-1258).