utf8mb4字符集(4字节UTF-8 Unicode编码)
该utfmb4字符集有以下特点:
- 支持BMP和补充字符。
- 每个多字节字符最多需要四个字节。
utf8mb4与utf8mb3字符集形成对比,该字符集仅支持BMP字符,每个字符最多使用三个字节:
- 对于BMP字符,
utf8mb4并utf8mb3具有相同的存储特性:相同的代码值,相同的编码,相同的长度。 - 对于补充字符,
utf8mb4需要四个字节来存储它,而utf8mb3根本不能存储该字符。将utf8mb3列转换为时utf8mb4,您不必担心转换辅助字符,因为将没有补充字符。
utf8mb4是的超集utf8mb3,因此对于诸如以下串联的操作,结果具有字符集utf8mb4和的校验规则utf8mb4_col:
SELECT CONCAT(utf8mb3_col, utf8mb4_col);
类似地,该WHERE子句中的以下比较根据的校验规则起作用utf8mb4_col:
SELECT *FROM utf8mb3_tbl, utf8mb4_tblWHERE utf8mb3_tbl.utf8mb3_col = utf8mb4_tbl.utf8mb4_col;
有关与多字节字符集相关的数据类型存储的信息,请参阅《字符串类型存储要求》。
