> 技术文档 > 25. html 使用的字符集是什么,有什么特点

25. html 使用的字符集是什么,有什么特点


总结

  1. utf-8,支持所有语言

一、HTML 默认使用的字符集

HTML 页面推荐使用 UTF-8 字符

<meta charset=\"UTF-8\" />

这是 HTML5 中推荐的标准字符编码,用于定义网页中字符的编码方式。


二、什么是字符集(Character Encoding)?

字符集是一组字符与对应二进制表示之间的映射关系。

  • ASCII:最早的字符集,仅支持 128 个英文字符。
  • ISO-8859-1:扩展 ASCII,支持西欧语言(如法语、德语)。
  • GBK / GB2312 / GB18030:中文字符集,支持简体中文。
  • UTF-8:现代通用字符集,支持全球所有语言。

三、UTF-8 的特点

特点 说明 ✅ 全球通用 支持所有语言(包括中文、日文、阿拉伯语等) ✅ 可变长度编码 1~4 字节表示一个字符,节省存储空间 ✅ 向下兼容 ASCII 英文字符占用 1 字节,与 ASCII 完全兼容 ✅ 广泛支持 被现代浏览器、服务器、数据库广泛支持 ✅ 无乱码风险 避免因编码不一致导致的乱码问题

四、如何设置 HTML 页面的字符集?

在 HTML 文档的 部分添加以下 标签:

<!DOCTYPE html><html lang=\"zh-CN\"> <head> <meta charset=\"UTF-8\" /> <title>示例页面</title> </head> <body> ... </body></html>

⚠️ 注意: 应该尽可能放在 的最前面,确保浏览器第一时间识别编码。


五、服务器端设置字符集(可选)

除了 HTML 中声明字符集,服务器也应通过 HTTP 响应头指定编码:

Content-Type: text/html; charset=UTF-8

✅ 推荐前后端统一使用 UTF-8,避免因编码不一致导致的乱码问题。


六、常见乱码原因及解决方案

原因 解决方案 HTML 文件保存格式不是 UTF-8 使用编辑器保存为 UTF-8 编码 未设置 添加 服务器响应头未指定编码 设置 HTTP 响应头 Content-Type: text/html; charset=UTF-8 数据库编码不一致 数据库、连接、页面统一使用 UTF-8

七、总结

内容 说明 推荐字符集 UTF-8 优点 支持多语言、兼容性强、节省空间、无乱码 HTML 设置方式 服务器设置 推荐响应头中设置编码 实际建议 前端、后端、数据库统一使用 UTF-8 编码