Quando si sviluppa una pagina web, uno dei problemi più ricorrenti è la
corretta gestione del charset (o set di caratteri). Ogni paese ovviamente ha il suo charset e quando un documento html viene scritto (e successivamente interpretato dal browser) dovrebbe utilizzare il charset corretto per evitare "storpiature" durante la visualizzazione della pagina web.
In Italia, o comunque, per la corretta formattazione di documenti in italiano, il set di caratteri da utilizzare è l'
ISO-8859-1(Latin 1) che rappresenta anche il set di caratteri tipico dell'Europa Occidentale. Questa codifica contiene ovviamente le lettere dell'alfabeto, i numeri, la punteggiatura e i simboli tipici della nostra cultura (per es. l'€ o il $) ma anche delle altre lingue dell'Europa Occidentale.
Vediamo ora in pratica come definire correttamente il set di caratteri da utilizzare in una pagina HTML:
<meta http-equiv="Content-Type" content="text/html;charset=ISO-8859-1">
Con questa intestazione dovremmo essere sicuri (ma non al 100%) che gli utenti riusciranno a leggere correttamente il testo scritto nel nostro documento. Questo scarto è dovuto a diversi fattori come per esempio il browser utilizzato o il charset di default del web server che ospita le nostre pagine web.
Per ovviare a ciò è consigliabile sostituire ai caratteri accentati, i simboli o ai caratteri speciali, la corrispondente entità HTML. Attenzione che alcuni caratteri speciali (vedi i primi 5) essendo propri della sintassi dei linguaggi HTML e XHTML potrebbero creare dei problemi nell'output della pagina (in quanto potrebbero essere interpretati invece che semplicemente visualizzati!). Vediamo di seguito quelli più largamente utilizzati:
Entità testuale | Entità numerica | Simbolo |
---|
" | " | " |
& | & | & |
' | ' | ' |
< | < | < |
> | > | > |
|   | (spazio) |
£ | £ | £ |
© | © | © |
« | « | « |
® | ® | ® |
° | ° | ° |
» | » | » |
¼ | ¼ | ¼ |
½ | ½ | ½ |
¾ | ¾ | ¾ |
À | À | À |
Á | Á | Á |
 |  |  |
à | à | à |
Ä | Ä | Ä |
Å | Å | Å |
Æ | Æ | Æ |
Ç | Ç | Ç |
È | È | È |
É | É | É |
Ê | Ê | Ê |
Ë | Ë | Ë |
Ì | Ì | Ì |
Í | Í | Í |
Î | Î | Î |
Ï | Ï | Ï |
Ð | Ð | Ð |
Ñ | Ñ | Ñ |
Ò | Ò | Ò |
Ó | Ó | Ó |
Ô | Ô | Ô |
Õ | Õ | Õ |
Ö | Ö | Ö |
× | × | × |
Ø | Ø | Ø |
Ù | Ù | Ù |
Ú | Ú | Ú |
Û | Û | Û |
Ü | Ü | Ü |
Ý | Ý | Ý |
Þ | Þ | Þ |
ß | ß | ß |
à | à | à |
á | á | á |
â | â | â |
ã | ã | ã |
ä | ä | ä |
å | å | å |
æ | æ | æ |
ç | ç | ç |
è | è | è |
é | é | é |
ê | ê | ê |
ë | ë | ë |
ì | ì | ì |
í | í | í |
î | î | î |
ï | ï | ï |
ð | ð | ð |
ñ | ñ | ñ |
ò | ò | ò |
ó | ó | ó |
ô | ô | ô |
õ | õ | õ |
ö | ö | ö |
÷ | ÷ | ÷ |
ø | ø | ø |
ù | ù | ù |
ú | ú, | ú |
û | û | û |
ü | ü | ü |
ý | ý | ý |
þ | þ | þ |
ÿ | ÿ | ÿ |