Première publication 17 avril 2003.
Dernière modification 17 avril 2003.
Il arrive parfois que l'on ait besoin d'insérer dans un document HTML des caractères qui ne font pas partie des caractères que l'on trouve habituellement sur son clavier, par exemple pour écrire dzień dobry ou こんにちは !
Avec HTML 4.01 l'ensemble des caractères utilisables est celui de l'ISO 10646. Cet ensemble comprend les caractères des principales langues actuelles (enfin surtout celles pour lesquelles les fabricants informatiques peuvent vendre leurs produits).
Il est possible donc d'insérer n'importe quel caractère de l'ISO 10646 dans un document HTML 4.01. Si vous ne disposez ni d'un clavier, ni d'un logiciel permettant la saisie facile des caractères dont vous avez besoin, il est possible d'insérer la référence numérique du caractère directement dans le code HTML de votre document.
Pour insérer un caractère de cette manière, il faut d'abord connaître le nombre associé au caractère désiré dans le standard ISO 10646. Vous pouvez obtenir beaucoup d'informations sur les caractères sur le site du Consortium Unicode : <http://www.unicode.org/>.
Alors que les équipes de normalisation de l'ISO n'en étaient encore qu'à la réflexion sur le cahier des charges pour l'établissement de la norme 10646, certains fabricants informatiques, réunis au sein du Consortium Unicode, avaient déjà établi un standard pratique pour la prise en compte de nombreuses langues. La norme ISO 10646 et le standard Unicode ont beaucoup de chose en commun et la norme ISO incorpore les informations du standard Unicode. De plus, contrairement aux normes ISO qu'on ne peut obtenir qu'en achetant (très cher) les documents de l'ISO, les informations sur le standard Unicode sont accessibles gratuitement sur le site du Consortium.
En parcourant le site Unicode je vois que le symbole est associé au nombre hexadécimal 0250. Pour insérer ce caractère dans mon document, il faut que je saisisse la séquence ɐ (les trois caractères &#x suivis du nombre hexadecimal de mon caractère et enfin ;).
Par exemple, si dans le code HTML de mon document je tape
<p>Le symbole API ɐ est une voyelle centrale ouverte<p>.
je devrais voir afficher dans mon navigateur
Le symbole API ɐ est une voyelle centrale ouverte.
Par contre rien ne garanti que le texte saisi de cette manière soit affiché correctement par le navigateur des personnes consultant votre page. Il faut que le navigateur et le système d'exploitation utilisés par le visiteur comprennent HTLM 4.0, Unicode et que des polices de caractères Unicode soient installées. Normalement les outils informatiques récents ne devraient pas avoir de problème pour afficher votre document. Je n'ai pas de problème d'affichage avec les navigateurs Netscape, Mozilla, Safari, Opera sur les machines fonctionnant avec les système d'exploitation Linux (Debian et Red-Hat) ou Mac OS X. Et en dehors du fait que je ne comprends rien à ce qui est affiché, les pages des sites <http://www.doshisha.ac.jp/>, <http://www.uw.edu.pl/>, <http://www.cu.edu.eg/arabic/default.htm> ou <http://www.huji.ac.il/unew/hebrew/mainnf.html> s'affichent correctement sur ma machine.
Les caractères sont ceux d'une partie de la table ISO 8859-2 qui est utilisée pour les systèmes d'écriture d'Europe centrale (croate, tchèque, hongrois, polonais roumain, slovaque, serbe).
Référence numérique | Caractère | Dénomination Unicode |
Ą | Ą | LATIN CAPITAL LETTER A WITH OGONEK |
˘ | ˘ | BREVE |
Ł | Ł | LATIN CAPITAL LETTER L WITH STROKE |
¤ | ¤ | CURRENCY SIGN |
Ľ | Ľ | LATIN CAPITAL LETTER L WITH CARON |
Ś | Ś | LATIN CAPITAL LETTER S WITH ACUTE |
§ | § | SECTION SIGN |
¨ | ¨ | DIAERESIS |
Š | Š | LATIN CAPITAL LETTER S WITH CARON |
Ş | Ş | LATIN CAPITAL LETTER S WITH CEDILLA |
Ť | Ť | LATIN CAPITAL LETTER T WITH CARON |
Ź | Ź | LATIN CAPITAL LETTER Z WITH ACUTE |
­ | | SOFT HYPHEN |
Ž | Ž | LATIN CAPITAL LETTER Z WITH CARON |
Ż | Ż | LATIN CAPITAL LETTER Z WITH DOT ABOVE |
° | ° | DEGREE SIGN |
ą | ą | LATIN SMALL LETTER A WITH OGONEK |
˛ | ˛ | OGONEK |
ł | ł | LATIN SMALL LETTER L WITH STROKE |
´ | ´ | ACUTE ACCENT |
ľ | ľ | LATIN SMALL LETTER L WITH CARON |
ś | ś | LATIN SMALL LETTER S WITH ACUTE |
ˇ | ˇ | CARON |
¸ | ¸ | CEDILLA |
š | š | LATIN SMALL LETTER S WITH CARON |
ş | ş | LATIN SMALL LETTER S WITH CEDILLA |
ť | ť | LATIN SMALL LETTER T WITH CARON |
ź | ź | LATIN SMALL LETTER Z WITH ACUTE |
˝ | ˝ | DOUBLE ACUTE ACCENT |
ž | ž | LATIN SMALL LETTER Z WITH CARON |
ż | ż | LATIN SMALL LETTER Z WITH DOT ABOVE |
Ŕ | Ŕ | LATIN CAPITAL LETTER R WITH ACUTE |
Á | Á | LATIN CAPITAL LETTER A WITH ACUTE |
 |  | LATIN CAPITAL LETTER A WITH CIRCUMFLEX |
Ă | Ă | LATIN CAPITAL LETTER A WITH BREVE |
Ä | Ä | LATIN CAPITAL LETTER A WITH DIAERESIS |
Ĺ | Ĺ | LATIN CAPITAL LETTER L WITH ACUTE |
Ć | Ć | LATIN CAPITAL LETTER C WITH ACUTE |
Ç | Ç | LATIN CAPITAL LETTER C WITH CEDILLA |
Č | Č | LATIN CAPITAL LETTER C WITH CARON |
É | É | LATIN CAPITAL LETTER E WITH ACUTE |
Ę | Ę | LATIN CAPITAL LETTER E WITH OGONEK |
Ë | Ë | LATIN CAPITAL LETTER E WITH DIAERESIS |
Ě | Ě | LATIN CAPITAL LETTER E WITH CARON |
Í | Í | LATIN CAPITAL LETTER I WITH ACUTE |
Î | Î | LATIN CAPITAL LETTER I WITH CIRCUMFLEX |
Ď | Ď | LATIN CAPITAL LETTER D WITH CARON |
Đ | Đ | LATIN CAPITAL LETTER D WITH STROKE |
Ń | Ń | LATIN CAPITAL LETTER N WITH ACUTE |
Ň | Ň | LATIN CAPITAL LETTER N WITH CARON |
Ó | Ó | LATIN CAPITAL LETTER O WITH ACUTE |
Ô | Ô | LATIN CAPITAL LETTER O WITH CIRCUMFLEX |
Ő | Ő | LATIN CAPITAL LETTER O WITH DOUBLE ACUTE |
Ö | Ö | LATIN CAPITAL LETTER O WITH DIAERESIS |
× | × | MULTIPLICATION SIGN |
Ř | Ř | LATIN CAPITAL LETTER R WITH CARON |
Ů | Ů | LATIN CAPITAL LETTER U WITH RING ABOVE |
Ú | Ú | LATIN CAPITAL LETTER U WITH ACUTE |
Ű | Ű | LATIN CAPITAL LETTER U WITH DOUBLE ACUTE |
Ü | Ü | LATIN CAPITAL LETTER U WITH DIAERESIS |
Ý | Ý | LATIN CAPITAL LETTER Y WITH ACUTE |
Ţ | Ţ | LATIN CAPITAL LETTER T WITH CEDILLA |
ß | ß | LATIN SMALL LETTER SHARP S |
ŕ | ŕ | LATIN SMALL LETTER R WITH ACUTE |
á | á | LATIN SMALL LETTER A WITH ACUTE |
â | â | LATIN SMALL LETTER A WITH CIRCUMFLEX |
ă | ă | LATIN SMALL LETTER A WITH BREVE |
ä | ä | LATIN SMALL LETTER A WITH DIAERESIS |
ĺ | ĺ | LATIN SMALL LETTER L WITH ACUTE |
ć | ć | LATIN SMALL LETTER C WITH ACUTE |
ç | ç | LATIN SMALL LETTER C WITH CEDILLA |
č | č | LATIN SMALL LETTER C WITH CARON |
é | é | LATIN SMALL LETTER E WITH ACUTE |
ę | ę | LATIN SMALL LETTER E WITH OGONEK |
ë | ë | LATIN SMALL LETTER E WITH DIAERESIS |
ě | ě | LATIN SMALL LETTER E WITH CARON |
í | í | LATIN SMALL LETTER I WITH ACUTE |
î | î | LATIN SMALL LETTER I WITH CIRCUMFLEX |
ď | ď | LATIN SMALL LETTER D WITH CARON |
đ | đ | LATIN SMALL LETTER D WITH STROKE |
ń | ń | LATIN SMALL LETTER N WITH ACUTE |
ň | ň | LATIN SMALL LETTER N WITH CARON |
ó | ó | LATIN SMALL LETTER O WITH ACUTE |
ô | ô | LATIN SMALL LETTER O WITH CIRCUMFLEX |
ő | ő | LATIN SMALL LETTER O WITH DOUBLE ACUTE |
ö | ö | LATIN SMALL LETTER O WITH DIAERESIS |
÷ | ÷ | DIVISION SIGN |
ř | ř | LATIN SMALL LETTER R WITH CARON |
ů | ů | LATIN SMALL LETTER U WITH RING ABOVE |
ú | ú | LATIN SMALL LETTER U WITH ACUTE |
ű | ű | LATIN SMALL LETTER U WITH DOUBLE ACUTE |
ü | ü | LATIN SMALL LETTER U WITH DIAERESIS |
ý | ý | LATIN SMALL LETTER Y WITH ACUTE |
ţ | ţ | LATIN SMALL LETTER T WITH CEDILLA |
˙ | ˙ | DOT ABOVE |
Spécification HTML 4.01 : <https://www.w3.org/TR/html401/>.
Standard Unicode : <http://www.unicode.org/>.
Correspondance ISO 8859-2 vers Unicode : <http://www.unicode.org/Public/MAPPINGS/ISO8859/8859-2.TXT>.