Dominique Meeùs
Dernière modification le   
retour à la table des matières — à l’index — à ma page de départ

Encodages modernes

On n’utilise plus aujourd’hui qu’un seul système où on a dissocié

Le jeu de caractères est fixé dans la norme ISO 10646. La norme Unicode (1991), gérée par le consortium Unicode (http://www.unicode.org/) ajoute à ce jeu de caractères un certain nombre de règles. Le plan multilingue de base (PMB, en anglais Basic Multilingual Plane ou BMP) comprenait 65 536 points de code, mais avec le chinois on l’a dépassé. On est actuellement dans les cent mille caractères. (J’aborde ailleurs les aspects pratiques.)

La famille XML de langages de balisage suppose que le texte est par défaut et de préférence encodé en UTF-8.

Dominique Meeùs . Date: 2011… 2017