HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集!

然而并非一直如此。早期 Web 的字符编码为 ASCII。

后来,从 HTML 2.0 到 HTML 4.01,ISO-8859-1 被视为标准字符集。

有了 XML 和 HTML5,UTF-8 终于出现并解决了许多字符编码问题。

字符集发展历程

  • 最初:ASCII

    计算机数据以二进制代码(01000101)存储在电子设备中。
    为了使文本的存储标准化,创建了美国信息交换标准码(American Standard Code for Information Interchange,ASCII)。它为每个可存储字符定义了一个唯一的二 进制数字,以支持 0-9 之间的数字、大写和小写字母(a-z,A-Z)以及特殊字符(比 如 ! $ + - ( ) @ < > ,)。
    由于 ASCII 使用 7 位字符,因此它只能表示 128 个不同的字符。
    ASCII 的最大缺点是,它排除了非英文字母。
    如今,ASCII 仍在使用,特别是在大型主机计算机系统中。

  • 在 Windows 中:Windows-1252

    Windows-1252 是 Windows(直到 Windows 95)中的默认字符集。
    它是 ASCII 的扩展,增加了国际字符。
    它使用一个完整的字节(8 位)表示 256 个不同的字符。
    由于 Windows-1252 是 Windows 中的默认设置,因此所有浏览器都支持它。

  • 在 HTML 4 中:ISO-8859-1
    HTML 4 中最常用的字符集是 ISO-8859-1。
    ISO-8859-1 是 ASCII 的扩展,增加了国际字符。
    在 HTML 4 中,可以在 标签中指定与 ISO-8859-1 不同的字符集:所有 HTML 4 处理器也都支持 UTF-8:当浏览器检测到 ISO-8859-1 时,它通常默认为 Windows-1252,因为 Windows-1252 还有 32 个国际字符。

  • 在 HTML5 中:Unicode UTF-8
    HTML5 规范鼓励 Web 开发人员使用 UTF-8 字符集。
    Unicode 联盟开发了 UTF-8 和 UTF-16 标准,因为 ISO-8859 字符集是受限制的,并且不兼容多语言环境。
    Unicode 标准(几乎)涵盖世界上所有的字符、标点和符号。
    所有 HTML5 和 XML 处理器都支持 UTF-8、UTF-16、Windows-1252 和 ISO-8859。

这里我们重点描述下 UTF-8 货币符号

范围:十进制 8352-8399,十六进制 20A0-20CF

 如果您希望在 HTML 中显示特殊字符,可以使用下表中的 HTML 实体。
 如果字符没有 HTML 实体,则可以使用十进制(dec)或十六进制(hex)引用。
字符 十进制 十六进制 实体 名称
8352 20A0 欧元货币符号(EURO-CURRENCY SIGN)
8353 20A1 科朗符号(COLON SIGN)
8354 20A2 克鲁塞罗符号(CRUZEIRO SIGN)
8355 20A3 法国法郎符号(FRENCH FRANC SIGN)
8356 20A4 里拉符号(LIRA SIGN)
8357 20A5 MILL SIGN
8358 20A6 奈拉符号(NAIRA SIGN)
8359 20A7 比塞塔符号(PESETA SIGN)
8360 20A8 卢比符号(RUPEE SIGN)
8361 20A9 朝鲜圆符号(WON SIGN)
8362 20AA 新的谢克尔符号(NEW SHEQEL SIGN)
8363 20AB 越南盾符号(DONG SIGN)
8364 20AC &euro; 欧元符号(EURO SIGN)
8365 20AD 基普符号(KIP SIGN)
8366 20AE 图格里克符号(TUGRIK SIGN)
8367 20AF 德拉克马符号(DRACHMA SIGN)
8368 20B0 德国便士符号(GERMAN PENNY SYMBOL)
8369 20B1 比索符号(PESO SIGN)
8370 20B2 瓜拉尼符号(GUARANI SIGN)
8371 20B3 澳大利亚元符号(AUSTRAL SIGN)
8372 20B4 格里夫尼亚符号(HRYVNIA SIGN)
8373 20B5 塞地符号(CEDI SIGN)
8374 20B6 里弗弗尔符号(LIVRE TOURNOIS SIGN)
8375 20B7 SPESMILO SIGN
8376 20B8 坚戈符号(TENGE SIGN)
8377 20B9 印度卢比符号(INDIAN RUPEE SIGN)