utf8_unicode_ci与utf8_general_ci的区别

时间 2019-11-14

原文原文链接

当前，utf8_unicode_ci校对规则仅部分支持Unicode校对规则算法。一些字符仍是不能支持。而且，不能彻底支持组合的记号。这主要影响越南和俄罗斯的一些少数民族语言，如：Udmurt 、Tatar、Bashkir和Mari。算法

utf8_unicode_ci的最主要的特点是支持扩展，即当把一个字母看做与其它字母组合相等时。例如，在德语和一些其它语言中‘ß’等于‘ss’。code

utf8_general_ci是一个遗留的校对规则，不支持扩展。它仅可以在字符之间进行逐个比较。这意味着utf8_general_ci校对规则进行的比较速度很快，可是与使用utf8_unicode_ci的校对规则相比，比较正确性较差）。htm

例如，使用utf8_general_ci和utf8_unicode_ci两种校对规则下面的比较相等：排序

Ä = Aci

Ö = Ounicode

Ü = Uget

两种校对规则之间的区别是，对于utf8_general_ci下面的等式成立：扩展

ß = s语言

可是，对于utf8_unicode_ci下面等式成立：

ß = ss

对于一种语言仅当使用utf8_unicode_ci排序作的很差时，才执行与具体语言相关的utf8字符集校对规则。例如，对于德语和法语，utf8_unicode_ci工做的很好，所以再也不须要为这两种语言建立特殊的utf8校对规则。

utf8_general_ci也适用与德语和法语，除了‘ß’等于‘s’，而不是‘ss’以外。若是你的应用可以接受这些，那么应该使用utf8_general_ci，由于它速度快。不然，使用utf8_unicode_ci，由于它比较准确。