(PHP 5 >= 5.3.0, PHP 7, PECL intl >= 1.0.0)
规范化是将字符和字符序列转换为正式定义的底层表示的过程。当需要比较文本以进行排序和搜索时,此过程最为重要,但在存储文本时也使用此过程,以确保文本以一致的表示形式存储。Unicode联盟定义了许多反映应用程序各种需求的规范化表单:
- 规范化形式 D(NFD)-规范分解
- 正规化形式 C(NFC)-正则分解后的正则合成
- 标准化形式 KD(NFKD)-相容性分解
- 标准化形式 KC(NFKC)-相容性分解,然后是标准组合
不同的形式是根据文本上的一组转换定义的,这些转换由一个算法和一组数据文件表示。
Normalizer { /* 方法 */ public static getRawDecomposition ( string $input ) : string public static isNormalized ( string $input [, int $form = Normalizer::FORM_C ] ) : bool public static normalize ( string $input [, int $form = Normalizer::FORM_C ] ) : string }