50. HTML Encoding (Character Sets)

Para mostrar una página HTML correctamente, un navegador web debe saber qué juego de caracteres usar.

De ASCII a UTF-8

ASCII fue el primer estándar de codificación de caracteres. ASCII definió 128 caracteres diferentes que podrían usarse en Internet: números (0-9), letras inglesas (A-Z) y algunos caracteres especiales como ! $ + – ( ) @ < > .

ISO-8859-1 era el conjunto de caracteres predeterminado para HTML 4. Este conjunto de caracteres admitía 256 códigos de caracteres diferentes. HTML 4 también admitía UTF-8.

ANSI (Windows-1252) era el juego de caracteres original de Windows. ANSI es idéntico a ISO-8859-1, excepto que ANSI tiene 32 caracteres adicionales.

La especificación HTML5 alienta a los desarrolladores web a utilizar el conjunto de caracteres UTF-8, que cubre casi todos los caracteres y símbolos del mundo.

El atributo HTML charset

Para mostrar una página HTML correctamente, un navegador web debe conocer el juego de caracteres utilizado en la página. Esto se especifica en la etiqueta <meta>:

<meta charset="UTF-8">
Scroll al inicio