MySQL 字符集问题

最近公司一个旧的项目须要支持 emoji 表情,一开始觉得只要修改下数据库的表字段就好,没想到引起了一系列的问题。这里总结下,以做备忘。html

01 MySQL 字符集设置mysql

  • 系统变量:sql

clipboard.png

character_set_server: 默认的内部操做字符集
character_set_client: 客户端来源数据使用的字符集
character_set_connection:链接层字符集
character_set_results: 查询结果字符集
character_set_database: 当前选中数据库的默认字符集
character_set_system: 系统元数据(字段名等)字符集数据库

02 MySQL 中的字符集转换过程spa

  • MySQL Server收到请求时将请求数据从 character_set_client 转换为character_set_connection命令行

  • 进行内部操做前将请求数据从 character_set_connection 转换为内部操做字符集,其肯定方法以下:code

    • 使用表中字段的 CHARACTER SET 设定值;server

    • 若上述值不存在,则使用对应数据表的 DEFAULT CHARACTER SET 设定值(MySQL扩展,非SQL标准);htm

    • 若上述值不存在,则使用对应数据库的 DEFAULT CHARACTER SET 设定值;排序

    • 若上述值不存在,则使用 character_set_server 设定值。

  • 将操做结果从内部操做字符集转换为 character_set_results, 响应请求。

03 MySQL 启动配置文件 my.cnf

clipboard.png

default-character-set: 设置 mysql 命令行链接的默认字符集
character-set-server: 设置系统内部操做字符集(即上文说到的character_set_server)
collation_server: 设置系统默认字符集排序

04 PHP链接 MySQL(以PDO链接方式为例)

常见的两种设置字符集的方式

  • mysql:host=localhost;dbname=db_demo;charset=utf8mb4

  • PDO::MYSQL_ATTR_INIT_COMMAND => "SET NAMES utf8mb4"

05 总结

  • 数据表字段的字符集须要是utf8mb4,这个是刚需

  • 通常 character_set_clientcharacter_set_connectioncharacter_set_results 的字符集相同,且都为utf8mb4(这三个参数默认都是utf8mb4,若是不是,是实现不了 emoji 表情的,缘由参照字符集转换过程)。

  • 链接数据库的字符集也须要是utf8mb4

  • character_set_servercharacter_set_database 等默认字符集的类型并无那么重要,但最好仍是保持一致

  • TP 的坑果真是多,远离TP

参考

相关文章
相关标签/搜索