utf8mb4字符集(4字节UTF-8 Unicode编码)
该utfmb4
字符集有以下特点:
- 支持BMP和补充字符。
- 每个多字节字符最多需要四个字节。
utf8mb4
与utf8mb3
字符集形成对比,该字符集仅支持BMP字符,每个字符最多使用三个字节:
- 对于BMP字符,
utf8mb4
并utf8mb3
具有相同的存储特性:相同的代码值,相同的编码,相同的长度。 - 对于补充字符,
utf8mb4
需要四个字节来存储它,而utf8mb3
根本不能存储该字符。将utf8mb3
列转换为时utf8mb4
,您不必担心转换辅助字符,因为将没有补充字符。
utf8mb4
是的超集utf8mb3
,因此对于诸如以下串联的操作,结果具有字符集utf8mb4
和的校验规则utf8mb4_col
:
SELECT CONCAT(utf8mb3_col, utf8mb4_col);
类似地,该WHERE
子句中的以下比较根据的校验规则起作用utf8mb4_col
:
SELECT *FROM utf8mb3_tbl, utf8mb4_tblWHERE utf8mb3_tbl.utf8mb3_col = utf8mb4_tbl.utf8mb4_col;
有关与多字节字符集相关的数据类型存储的信息,请参阅《字符串类型存储要求》。