PHP 中执行排序与 MySQL 中排序

此文首发在 InfoQ 中文站做者:明灵(dragon) , Fenng . Note:要转载的朋友请注意注明这篇文章的第一做者!
这篇文章是dragon 朋友来邮探讨后他作的一个总结。在 DB 中排序仍是在 应用程序中排序是个颇有趣的话题,dragon 第一份邮件中其实已经总结的很好了,我添加了一点建议而已。如今放上来,与你们共享。这篇文章也投稿到了 InfoQ 中文站数据库

Q:列出在 PHP 中执行排序要优于在 MYSQL 中排序的缘由?给一些必须在MYSQL中排序的实例?

A:一般来讲,执行效率须要考虑 CPU、内存和硬盘等的负载状况,假定 MYSQL 服务器和 PHP 的服务器都已经按照最适合的方式来配置,那么系统的可伸缩性(Scalability)和用户感知性能(User-perceived Performance)是咱们追求的主要目标。在实际运行中,MYSQL 中数据每每以 HASH tables、BTREE 等方式存贮于内存,操做速度很快;同时 INDEX 已经进行了一些预排序;不少应用中,MYSQL 排序是首选。而在应用层(PHP)中排序,也必然在内存中进行,与 MYSQL 相比具备以下优点:服务器

  • 一、 考虑整个网站的可伸缩性和总体性能,在应用层(PHP)中排序明显会下降数据库的负载,从而提高整个网站的扩展能力。而数据库的排序,实际上成本是很是高的,消耗内存、CPU,若是并发的排序不少,DB 很容易到瓶颈。
  • 二、 若是在应用层(PHP)和MYSQL之间还存在数据中间层,合理利用,PHP会有更好的收益。
  • 三、 PHP在内存中的数据结构专门针对具体应用来设计,比数据库更为简洁、高效;
  • 四、 PHP不用考虑数据灾难恢复问题,能够减小这部分的操做损耗;
  • 五、 PHP不存在表的锁定问题;
  • 六、 MYSQL中排序,请求和结果返回还须要经过网络链接来进行,而PHP中排序以后就能够直接返回了,减小了网络IO。

至于执行速度,差别应该不会很大,除非应用设计有问题,形成大量没必要要的网络IO。另外,应用层要注意PHP 的 Cache 设置,若是超出会报告内部错误;此时要根据应用作好评估,或者调整Cache。具体选择,将取决于具体的应用。网络

列出一些 PHP 中执行排序更优的状况:

  • 一、 数据源不在 MYSQL 中,存在硬盘、内存或者来自网络的请求等;
  • 二、 数据存在 MYSQL 中,量不大,并且没有相应的索引,此时把数据取出来用PHP排序更快;
  • 三、 数据源来自于多个 MYSQL 服务器,此时从多个 MYSQL 中取出数据,而后在PHP中排序更快;
  • 四、 除了 MYSQL 以外,存在其余数据源,好比硬盘、内存或者来自网络的请求等,此时不适合把这些数据存入 MYSQL 后再排序;

列出一些必须在 MYSQL 中排序的实例:

  • 一、 MYSQL 中已经存在这个排序的索引;
  • 二、 MYSQL 中数据量较大,而结果集须要其中很小的一个子集;好比 1000000 行数据,取TOP 10;
  • 三、 对于一次排序、屡次调用的状况,好比统计聚合的情形,能够提供给不一样的服务使用,那么在 MYSQL 中排序是首选的。另外,对于数据深度挖掘,一般作法是在应用层作完排序等复杂操做,把结果存入MYSQL便可,便于屡次使用。
  • 四、 不论数据源来自哪里,当数据量大到必定的规模后,因为占用内存/Cache 的关系,再也不适合 PHP 中排序了;此时把数据复制、导入或者存在 MYSQL ,并用 INDEX 优化,是优于 PHP 的。不过,用 Java,甚至 C++ 来处理这类操做会更好。 [有些相似大数据集聚合或者汇总的数据,在客户端排序得不偿失。固然,也有用相似搜索引擎的思路来解决相似应用的状况。]

从网站总体考虑,就必须加入人力和成本的考虑。假如网站规模和负载较小,而人力有限(人数和能力均可能有限),此时在应用层(PHP)作排序要作很多开发和调试工做,耗费时间,得不偿失;不如在 DB 中处理,简单快速。对于大规模的网站,电力、服务器的费用很高,在系统架构上精打细算,能够节约大量的费用,是公司持续发展之必要;此时若是能在应用层(PHP) 进行排序并知足业务需求,尽可能在应用层进行数据结构

相关文章
相关标签/搜索