Quand une page est stockée dans le serveur en format Unicode UTF-8, mais affichée dans le navigateur par erreur en mode de caractère uni-octet, abusivement appelé ASCII, ie, en charset=windows-1252, ce caractère Unicode UTF-8 prend deux places.
Essayez le caractère é Unicode: il est doublé en é
Il était une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Au contraire si votre page est stockée dans le serveur web en format ANSI/ASCII, mais affichée dans le navigateur du client par erreur en mode de caractère multi-octet UTF-8, appelé Unicode, en mode Unicode UTF-8, ie, en charset=UTF-8, ce caractère ASCII devient plus mince encore pour devenir un diamant point d'interrogation ou carrテゥ vide, comme s'il n'est pas assez costaud pour occuper même une seule place dans le monde Unicode qui est multi-octet.
En rティgle gテゥnテゥrale, quand votre fichier est en codage plus petit, plus maigre que le codage du navigateur テ� l'affichage, le diamant point d'interrogation ou carrテゥ vide � apparaテョt.
Essayez le caractère é ASCII: il est réduit en diamant point d'interrogation ou carrテゥ vide �.
Il �tait une fois dans l'Ouest de la Chine... il faisait froid en hiver.
Il est utile de prテゥciser que tous les caractティres ASCII du code 0 テ� 127 gardent toujours les mテェmes codes sans changement quelque soit le codage des caractティres, ASCII, GBK, Unicode...
Tous les caractティres ASCII テゥtendus du code 0 テ� 255 (2**8=256, uni-octet, mono-byte) peuvent テェtre stockテゥs soit dans un fichier ASCII, soit en format Unicode UTF-8. Le contraire n'est pas vrai, les caractティres multi-octet (multi-byte) avec un code supテゥrieur ou テゥgal テ� 256, qui ne peuvent テェtre conservテゥs que dans un fichier Unicode comme UTF-8, ou bien dans un format spテゥcifique (code page pays) tel le GBK pour les idテゥogrammes chinois.
Sur le web, un caractティre Unicode peut en outre s'exprimer en code entitテゥ HTML, ainsi stockテゥ dans un fichier du codage ASCII. Par exemple, l'idテゥogramme 隸ュ signifiant Langue, peut テェtre stockテゥ en mode ASCII par la chaテョne 语, composテゥe uniquement des ampersand &, diティse #, suivi par des chiffres du numテゥro dテゥcimal de ce caractティre en Unicode, et terminテゥ par un point-virgule ;.
荳ュ蝗ス蠎泌ッケ莠コ邀サ菴懷�霎�、ァ逧�エ。迪ョ��
La Chine doit faire une contribution relativement grande テ� l'Humanitテゥ !
ル異韓ェリケル館� リケル�� リァル�オル館� リェルぺッル館� リァリウル�ァル�ァリェ リァル�ィリア ル��ィリエリアル韓ゥ!
ミ墟クムひーミケ ミエミセミサミカミオミス ム�エミオミサミームび� ミアミセミサム袴威クミケ ミイミコミサミーミエ ミイ ム�オミサミセミイミオム�オム�ひイミセ!
ホ墅ッホスホア ホクホア ママ∃ュマホオホケ ホスホア マρ�シホイホャホサホオホケ マホオマ∃ケマρρ狐�オマ∃ソ マρ�キホス ホアホスホクマ�珂マ狐�キマ�ア!
荳ュ蝗ス縺ッ莠コ鬘槭↓螟ァ縺阪↑雋「迪ョ繧偵@縺ヲ縺上□縺輔>��
ラ泰。ラ燮� ラ燮ゥ ラェラィラ勉槞� ラ潰沌勉慵� ラ慵碩�ラ勉ゥラ勉ェ!
爨壟・爨ィ 爨ョ爨セ爨ィ爨オ 爨憫、セ爨、爨ソ 爨歩・� 爨イ爨ソ爨� 爨鐘、� 爨ャ爨。爨シ爨セ 爨ッ爭金、伶、ヲ爨セ爨ィ 爨歩、ー爨ィ爨セ 爨壟、セ爨ケ爨ソ爨�!
犧謂クオ犧吭ク�クァ犧」犧謂クー犹�クォ犹霞ク。犧オ犧ェ犹謂クァ犧吭ク」犹謂クァ犧。犧。犧イ犧≒クもクカ犹霞ク吭ケ犧樅クキ犹謂クュ犧。犧吭クク犧ゥ犧「犧癌クイ犧歩クエ!
レ�雇� リィリァロ鈷ッ リウル�� リィロ鈷エリェリアロ� リィル� リァル�ウリァル� リアリァ!
China shall make a relatively great contribution to the Man Kind!
Cette page est stockテゥe dans le disque dur en format UTF-8 sans BOM. Mais je vous propose de l'afficher en diffテゥrents codages. Elle peut devenir illisible si le codage diffティre trop. Il faut revenir en UTF-8 si vous avez mal テ� la tテェte. Testez vous-mテェme sur votre navigateur en cliquant sur les liens suivants:
[Auto Detection] (auto) | Arabic (ISO-8859-6) | Arabic (Windows-1256) | ASCII Western European (ISO-8859-1) | ASCII Western European (Windows-1252) | Baltic (ISO-8859-4) | Baltic (Windows-1257) | Central European (Windows-1250) | Chinese Simplified (GB18030) | Chinese Simplified (GB2312) | Chinese Simplified (GBK) | Chinese Simplified (HZ) | Chinese Traditional (Big5) | Cyrillic (ISO-8859-5) | Cyrillic (KOI8-R) | Cyrillic (KOI8-U) | Cyrillic (Windows-1251) | Greek (Windows-1253) | Hebrew (Windows-1255) | Hebrew (ISO-8859-8-l) | Celtic (ISO-8859-14) | Central European (ISO-8859-2) | Estonian (ISO-8859-13) | Greek (ISO-8859-7) | Hebrew (ISO-8859-8) | Japanese (EUC-JP) | Japanese (ISO-2022-JP) | Japanese (Shift_JIS) | Korean (EUC-KR) | Latin 9 (ISO-8859-15) | Nordic (ISO-8859-10) | Roumain (ISO-8859-16) | South European (ISO-8859-3) | Thai (TIS-620) | Turkish (ISO-8859-9) | Turkish (Windows-1254) | Unicode (UTF-16LE) | Unicode (UTF-8) | Vietnamese (Windows-1258).