Encodage HTML (jeu de caractères)

Pour afficher correctement une page HTML, le navigateur Web doit savoir quel jeu de caractères utiliser.

De ASCII à UTF-8

ASCII est la première norme de codage de caractères. ASCII définit 128 caractères utilisables sur Internet : chiffres (0-9), lettres (A-Z) et quelques caractères spéciaux, comme : ! $ + - ( ) @ < >.

ISO-8859-1 est le jeu de caractères par défaut de HTML 4. Ce jeu de caractères supporte 256 codes de caractères différents. HTML 4 supporte également UTF-8.

ANSI (Windows-1252) est le jeu de caractères original de Windows. ANSI est identique à ISO-8859-1, mais avec 32 caractères supplémentaires.

Le规范HTML5 encourage les développeurs Web à utiliser le jeu de caractères UTF-8, qui couvre presque tous les caractères et symboles du monde !

Attribut charset HTML

Pour afficher correctement une page HTML, le navigateur Web doit connaître le jeu de caractères utilisé dans la page.

Ce dans <meta> spécifié dans l'étiquette :

<meta charset="UTF-8">

Essayer personnellement

Les différences entre les jeux de caractères

Le tableau suivant montre les différences entre les jeux de caractères mentionnés précédemment :

Numb ASCII ANSI 8859 UTF-8 Description
32 espace
33!!!!exclamation point
34""""guillemet
35####signe de nombre
36$$$$signe dollar
37%%%%signe pour pourcentage
3838383838&
ampersand39393939'
apostrophe40404040(
left parenthesis41414141)
right parenthesis42424242*
asterisk43434343+
plus sign44444444,
comma45454545-
hyphen-minus46464646.
full stop47474747/
solidus484848480
digit zero494949491
digit one505050502
digit two515151513
digit three525252524
digit four535353535
digit five545454546
digit six555555557
digit seven565656568
digit eight575757579
digit nine58585858:
colon59595959;
semicolon60606060<
less-than sign61616161=
equals sign62626262>
greater-than sign????question mark
64@@@@commercial at
65AAAALatin capital letter A
66BBBBLatin capital letter B
67CCCCLatin capital letter C
68DDDDLatin capital letter D
69EEEELatin capital letter E
70FFFFLatin capital letter F
71GGGGLatin capital letter G
72HHHHLatin capital letter H
73IIIILatin capital letter I
74JJJJLatin capital letter J
75KKKKLatin capital letter K
76LLLLLatin capital letter L
77MMMMLatin capital letter M
78NNNNLatin capital letter N
79OOOOLatin capital letter O
Latin capital letter MNNNNLatin capital letter N
OLatin capital letter OLatin capital letter OLatin capital letter OLatin capital letter O80
PLatin capital letter PLatin capital letter PLatin capital letter PLatin capital letter P81
QLatin capital letter QLatin capital letter QLatin capital letter QLatin capital letter Q82
RLatin capital letter RLatin capital letter RLatin capital letter RLatin capital letter R83
SLatin capital letter SLatin capital letter SLatin capital letter SLatin capital letter S84
TLatin capital letter TLatin capital letter TLatin capital letter TLatin capital letter T85
ULatin capital letter ULatin capital letter ULatin capital letter ULatin capital letter U86
VLatin capital letter VLatin capital letter VLatin capital letter VLatin capital letter V87
WLatin capital letter WLatin capital letter WLatin capital letter WLatin capital letter W88
XLatin capital letter XLatin capital letter XLatin capital letter XLatin capital letter X89
YLatin capital letter YLatin capital letter YLatin capital letter YLatin capital letter Y90
ZLatin capital letter ZLatin capital letter ZLatin capital letter ZLatin capital letter Z91
[left square bracketleft square bracketleft square bracketleft square bracket\
reverse solidus]]]]right square bracket
^circumflex accentcircumflex accentcircumflex accentcircumflex accent_
low line````grave accent
97aaaaLatin small letter a
98bbbbLatin small letter b
99ccccLatin small letter c
100ddddLatin small letter d
101eeeeLatin small letter e
102ffffLatin small letter f
103ggggLatin small letter g
104hhhhLatin small letter h
105iiiiLatin small letter i
106jjjjLatin small letter j
107kkkkLatin small letter k
108llllLatin small letter l
109mmmmLatin small letter m
110nnnnLatin small letter n
111ooooLatin small letter o
112ppppLatin small letter p
113qqqqLatin small letter q
114114114114114r
lettre minuscule latine r115115115115s
lettre minuscule latine s116116116116t
lettre minuscule latine t117117117117u
lettre minuscule latine u118118118118v
lettre minuscule latine v119119119119w
lettre minuscule latine w120120120120x
lettre minuscule latine x121121121121y
lettre minuscule latine y122122122122z
lettre minuscule latine z123123123123{
brace gauche||||barre verticale
125}}}}brace droit
126~~~~tilde
127DEL    
128   signe euro
129 °°°guillemet simple pointant à droite
° 131  
guillemet bas simple 132  ˗
lettre minuscule latine f avec crochet 133  
guillemet bas simple double   point d'élipsis horizontal
134 ˆ  dague
135 ˊ  dague double
136 ˉ  lettre modifiée accent circonflexe
137 ˛  signe pour mille
138 ˝  lettre majuscule latine S avec caron
139   guillemet angle simple gauche
140 ˘  ligature majuscule latine OE
141 ˇˇˇguillemet simple pointant à droite
142   lettre majuscule latine Z avec caron
143 guillemet simple pointant à droite
144 ­­­guillemet simple pointant à droite
145 '  '
146 '  droite apostrophe
147 "  "
148 "  droite guillemet
149 •  bullet
150 –  en dash
151 149  •
point 150  –
tiret court —  tiret long
152 ˜  tilde minuscule
153 ™  signe marque de commerce
154 š  lettre minuscule latine s avec caron
155 ›››guillemet simple pointant à droite
156 œ  ligature latine minuscule oe
157   NOT USED
158    ž
lettre minuscule latine z avec caron 159159159Ÿ
lettre majuscule latine Y avec tréma 160160160espace non décomposable
¡ exclamation inverséexclamation inverséexclamation inversé¢
signe centime £££signe livre
¤ signe monétairesigne monétairesigne monétaire¥
signe yén 166166166¦
barre brisée 167167167§
signe section 168168168¨
tréma 169169169©
signe de copyright 170170170ª
indicateur ordinal féminin 171171171«
guillemet double angle pointing à gauche 172172172¬
signe non ­­­tiret mou
174 ®®®signe enregistré
175 ¯¯¯macron
176 °°°signe degré
177 ±±±signe plus moins
178 ²²²superscripte deux
179 ³³³superscripte trois
180 ´´´accents aigu
181 µµµsigne micro
182 signe paragraph
183 ···point médian
184 ¸¸¸cédille
185 ¹¹¹superscripte un
186 ºººindicateur ordinal masculin
187 »»»right-pointing double angle quotation mark
188 ¼¼¼vulgar fraction one quarter
189 ½½½vulgar fraction one half
190 ¾¾¾vulgar fraction three quarters
191 ¿¿¿inverted question mark
192 ÀÀÀLatin capital letter A with grave
193 ÁÁÁLatin capital letter A with acute
194 ÂÂÂLatin capital letter A with circumflex
195 ÃÃÃLatin capital letter A with tilde
196 ÄÄÄLatin capital letter A with diaeresis
197 ÅÅÅLatin capital letter A with ring above
198 ÆÆÆLatin capital letter AE
199 ÇÇÇLatin capital letter C with cedilla
200 ÈÈÈLatin capital letter E with grave
201 ÉÉÉLatin capital letter E with acute
202 ÊÊÊLatin capital letter E with circumflex
203 ËËËLatin capital letter E with diaeresis
204 ÌÌÌLatin capital letter I with grave
205 ÍÍÍLatin capital letter I with acute
206 ÎÎÎLatin capital letter I with circumflex
207 ÏÏÏLatin capital letter I with diaeresis
208 ÐÐÐLatin capital letter Eth
209 ÑÑÑLatin capital letter N with tilde
210 ÒÒÒLatin capital letter O with grave
211 ÓÓÓLatin capital letter O with acute
212 ÔÔÔLatin capital letter O with circumflex
213 ÕÕÕLatin capital letter O with tilde
214 ÖÖÖLatin capital letter O with diaeresis
215 ×××multiplication sign
216 ØØØLatin capital letter O with stroke
217 ÙÙÙLatin capital letter U with grave
218 ÚÚÚLatin capital letter U with acute
219 ÛÛÛLatin capital letter U with circumflex
220 ÜÜÜLatin capital letter U with diaeresis
221 ÝÝÝLatin capital letter Y with acute
222 ÞÞÞLatin capital letter Thorn
223 ßßßLatin small letter sharp s
224 àààLatin small letter a with grave
225 áááLatin small letter a with acute
226 âââLatin small letter a with circumflex
227 ãããLatin small letter a with tilde
228 äääLatin small letter a with diaeresis
229 åååLatin small letter a with ring above
230 æææLatin small letter ae
231 çççLatin small letter c with cedilla
232 èèèLatin small letter e with grave
233 233233233é
Petite lettre latine e avec accent aigu 234234234ê
Petite lettre latine e avec accent circonflexe 235235235ë
Petite lettre latine e avec tréma 236236236ì
Petite lettre latine i avec accent grave 237237237í
Petite lettre latine i avec accent aigu 238238238î
Petite lettre latine i avec accent circonflexe 239239239ï
Petite lettre latine i avec tréma 240240240ð
Petite lettre latine eth 241241241ñ
Petite lettre latine n avec tilde 242242242ò
Petite lettre latine o avec accent grave 243243243ó
Petite lettre latine o avec accent aigu 244244244ô
Petite lettre latine o avec accent circonflexe 245245245õ
Petite lettre latine o avec tilde 246246246ö
Petite lettre latine o avec tréma 247247247÷
division sign øøøPetite lettre latine o avec barre oblique
249 ùùùPetite lettre latine u avec accent grave
250 úúúPetite lettre latine u avec accent aigu
251 ûûûPetite lettre latine avec accent circonflexe
252 üüüPetite lettre latine u avec tréma
253 ýýýPetite lettre latine y avec accent aigu
254 þþþPetite lettre latine thorn
255 ÿÿÿPetite lettre latine y avec tréma

Jeu de caractères ASCII

ASCII utilise les valeurs de 0 à 31 (et 127) comme caractères de contrôle.

ASCII utilise les valeurs de 32 à 126 pour représenter des lettres, des chiffres et des symboles.

ASCII n'utilise pas les valeurs de 128 à 255.

Encodage de caractères ANSI (Windows-1252)

Pour les valeurs de 0 à 127, ANSI est identique à ASCII.

ANSI a un ensemble de caractères spéciaux, dont les valeurs varient de 128 à 159.

Pour les valeurs de 160 à 255, ANSI est identique à UTF-8.

Encodage de caractères ISO-8859-1

Pour les valeurs de 0 à 127, 8859-1 est identique à ASCII.

8859-1 n'utilise pas les valeurs de 128 à 159.

Pour les valeurs de 160 à 255, 8859-1 est identique à UTF-8.

Encodage de caractères UTF-8

Pour les valeurs de 0 à 127, UTF-8 est identique à ASCII.

UTF-8 n'utilise pas les valeurs de 128 à 159.

Pour les valeurs de 160 à 255, UTF-8 est identique à ANSI et 8859-1.

UTF-8 continue à partir de la valeur 256, contient plus de 10000 de caractères différents.

Pour une étude plus approfondie, lisez notre manuel complet de caractères de codage HTML.

Règle @charset CSS

Vous pouvez utiliser la règle @charset CSS pour spécifier l'encodage de caractères utilisé dans la feuille de style :

Exemple

Définir l'encodage de la feuille de style en Unicode UTF-8 :

@charset "UTF-8";

Obtenez plus d'informations sur notre manuel de référence CSS. Règle @charset CSS du contenu.