PostgreSQL 简体中文区域设置性能改进实践

时间 2019-12-23

标签 postgresql 简体中文区域设置性能改进实践栏目 Postgre SQL 繁體版

原文原文链接

相关阅读《PostgreSQL 字符集下区域设置对性能的影响改进办法》
http://my.oschina.net/quanzl/blog/135721 数据库

按照这个思路，将中文排序信息内置于数据库内核之中，若是 locale 选择中文，由此检索排序位置，而不是经过系统API strcoll()。性能

encoding均为utf-8，数据量为54996，中文与ascii换杂，同一硬件平台，openSUSE。
如下为以 pgAdminIII 为客户端建立索引的测试结果： spa

locale=C，原生PG：查询成功但无结果，耗时: 140 毫秒(ms)。
locale=zh_CN.utf8，原生PG：查询成功但无结果，耗时: 985 毫秒(ms)。
locale=zh_CN.utf8，修改后：查询成功但无结果，耗时: 203 毫秒(ms)。操作系统

以上结果都是记录“建立、删除、再建立”过程的第二次建立时间。 .net

同时发现一个问题，Linux下平台的中文排序比较怪：
select * from (values('阿'),('啊'),('腌'),('包'),('')) as a(e) order by e;
返回结果
""
"腌"
"阿"
"啊"
"包"
猜想这里的“腌”，取“a za”发音。不是 yan 音。 blog

无论怎样，后边尝试跟社区沟通一下，看他们能不能接受。之前就PG在不一样系统下排序混乱的话题讨论，有位大仙说这样（使用操做系统排序）挺好。排序