Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carr챕 vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En r챔gle g챕n챕rale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur 횪 l'affichage, le diamant point d'interrogation ou carr챕 vide � appara챤t.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carr챕 vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de pr챕ciser que tous les caract챔res ASCII du code 0 횪 127 gardent toujours les m챗mes codes sans changement quelque soit le codage des caract챔res, ASCII, GBK, Unicode...
Tous les caract챔res ASCII 챕tendus du code 0 횪 255 (2**8=256, uni-octet, mono-byte) peuvent 챗tre stock챕s soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caract챔res multi-octet (multi-byte) avec un code sup챕rieur ou 챕gal 횪 256, qui ne peuvent 챗tre conserv챕s que dans un fichier Unicode comme UTF-8, ou bien dans un format sp챕cifique (code page pays) tel le GBK pour les id챕ogrammes chinois.
Sur le web, un caract챔re Unicode peut en outre s'exprimer en code entit챕 HTML, ainsi stock챕 dans un fichier du codage ASCII. Par exemple, l'id챕ogramme 瑥� signifiant Langue, peut 챗tre stock챕 en mode ASCII par la cha챤ne 语, compos챕e uniquement des ampersand &, di챔se #, suivi par des chiffres du num챕ro d챕cimal de ce caract챔re en Unicode, et termin챕 par un point-virgule ;.
訝�쎖佯붷�雅븀굳鵝쒎눣渦껃ㄷ�꾥뇟��펯
La Chine doit faire une contribution relativement grande 횪 l'Humanit챕 !
��魔晩�� 晩�� 碼�巒�� 魔�膜�� 碼卍�碼�碼魔 碼�磨邈 ��磨娩邈�馬!
�龜�逵橘 畇棘剋菌筠戟 �畇筠剋逵�� 閨棘剋��龜橘 勻克剋逵畇 勻 �筠剋棘勻筠�筠��勻棘!
�官館慣 罐慣 ��串�琯菅 館慣 ��關棺郭貫琯菅 �琯�菅����琯�恝 ��管館 慣館罐�����管�慣!
訝�쎖��볶窈욁겓鸚㎯걤�よ깻��굮�쀣겍�뤵걽�뺛걚竊�
�遼�� �漏 瘻淚��� ����� ����漏�瘻!
西싟�西� 西�ㅎ西ⓣㅅ 西쒉ㅎ西ㅰㅏ 西뺖쪍 西꿋ㅏ西� 西뤲쨻 西оㄱ西솰ㅎ 西�쪑西쀠ㄶ西약ㄸ 西뺖ㅀ西ⓣㅎ 西싟ㅎ西밝ㅏ西�!
錫댽링錫쇸툌錫㏅르錫댽린仙꺺릊仙됢륫錫듀릉仙댽름錫쇸르仙댽름錫□륫錫꿋툈錫귖마仙됢툢仙�錫왽막仙댽릎錫□툢錫멘릇錫№툓錫꿋툞錫�!
��� 磨碼�膜 卍�� 磨�娩魔邈� 磨� 碼�卍碼� 邈碼!
China shall make a relatively great contribution to the Man Kind!
Cette page est stock챕e dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diff챕rents codages. Elle peut devenir illisible si le codage diff챔re trop. Il faut revenir en UTF-8 si vous avez mal 횪 la t챗te. Testez vous-m챗me sur votre navigateur en cliquant sur les liens suivants:
[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).