Les caractères de notre alphabet sont représentés en informatique selon le code ASCII (American Standard Code for Information Interchange). Comme son nom l’indique, ce code a été développé aux Etats-Unis et ne tient pas compte, entre autres, des caractères accentués.
En fait, le code ASCII est capable de représenté 256 caractères, mais seuls les 128 premiers sont standard sur tous les types d’ordinateurs. C’est dans ces 128 premiers caractères que l’on trouve les lettres de l’alphabet, en minuscule et en majuscule, les chiffres et les signes de ponctuation.
Les caractères accentués occupent les 128 positions suivantes qui forment ce que l’on appelle l’ASCII étendu. Cette partie est différente selon la machine et il a donc fallu trouver, afin que le langage HTML puisse être véritablement universel, un moyen de représenter l’ASCII étendu en ASCII de base. Tous les caractères spéciaux sont donc représentés par un code, soit numérique (code ISO), soit alphabétique.
Représentation de quelques caractères :
Caractère | Code alphabétique |
é | é |
É | É |
è | è |
È | È |
à | à |
À | À |
ç | ç |
ê | ê |
î | î |
ñ | ñ |
& | & |
< | < |
> | > |
© | © |
® | ® |
Vous trouverez une liste plus détaillée de caractères spéciaux ici.
… et encore plus complète : ici
En rajoutant cette information dans le <head></head> de votre page html :
<meta charset="utf-8" />
Les caractères sont interprétés correctement