高性能高并发

时间 2019-11-18

标签高性能并发繁體版

原文原文链接

http://www.zhihu.com/search?q=%E9%AB%98%E5%B9%B6%E5%8F%91&type=questionhtml

http://storage.it168.com/a2012/0217/1313/000001313424_5.shtml前端

redis,nginx/Tengine,keeplive,DRBD,heartbeat这些小工具仍是能够在虚拟机上面多开几台跑起来的.至于大业务场景,除了进大公司没有别的办法,由于有些工具运行的配置要求过高,必须多台服务器配合才能完成.
若是有精力,业内很喜欢用perl,python,C来写一些针对热点业务的负载脚本.这须要有http协议等网络封包的理论基础.
一些建议处理高并发要学习的东西实在太多.要在没有实际工做经验的状况下逐一了解太难,也很难深刻.对于高并发的学习,我建议除了多阅读高并发架构的文档学习基本的方法论之外,本身要去深刻学习网络基础,数据结构和算法.这些都是处理高并发热点的理论基础.node

-----------------------------------------------------------------------------------------------------------------------python

进程和线程模型，非阻塞IO，epoll/iocp这些不提，横向扩展和读写分离，
hot standby这些老生常谈的也不算，memcached/redis缓存也不算，
也不扯nodejs，twisted，gevent，tornado，erlang等等有助于高并发的工具，
这些都不算，有哪些秘密? 感受作太高并发的都看不起同行了，到底有啥绝活?nginx

SEDA or Actor这类的设计的东西？redis

-----------------------------------------------------------------------------------------------------------------------算法

业务数据库 -》数据水平分割(分区分表分库)、读写分离
业务应用 -》逻辑代码优化(算法优化)、公共数据缓存
应用服务器 -》反向静态代理、配置优化、负载均衡(apache分发，多tomcat实例)
系统环境 -》 JVM调优
页面优化 -》减小页面链接数、页面尺寸瘦身spring

应用服务器配置优化，如链接数的优化，每一个请求都是独立的链接线程，因此优化此配置能够提升服务器接收HTTP并发请求的能力.固然，也不是支持的链接数越多越好。由于接收过多的HTTP请求，可能会致使服务器处理不了，宕机、瘫痪，相似铁路局购票网的情况。大部分的站点会根据服务器处理能力来设置链接数上限。

提高应用服务器的处理能力：
如多服务器集群，接收1000个请求分发多几个服务器去处理。同时，CPU主频，jvm，代码逻辑都不一样程度影响业务计算能力。

若是业务有对数据库进行操做的，那么磁盘的IO读写速率是影响服务器的处理能力的最大因素。
由于不管配置的链接数再多，也须要数据库服务器执行SQL时进行的磁盘IO读写能力支撑才行。关于数据库服务器将读写压力分担。经常使用的方法我上面已经总结了。。。sql

-----------------------------------------------------------------------------------------------------------------------数据库

用Java作一个大流量、高并发的网站应该怎么样进行底层构架？采用哪些框架技术比较适合？

通用措施：
一、动态资源和静态资源分离；
二、CDN；
三、负载均衡；
四、分布式缓存；
五、数据库读写分离或数据切分（垂直或水平）；
六、服务分布式部署。

没看到对业务的描述，业务不一样面对的多是相差很大的方案，太早介入性能方面的考虑未必是好事，有可能浪费太多时间在一些弯路上，若是实在担忧的话，尽可能采用一些扩展性强一点点的框架，仍是那句话，不要太早走极端。

多台tomcat作负载均衡，即便你效率再高。对于高并发，单台tomcat能管理的thread pool的线程数也是有限的
tomcat使用apr/nio模式增长吞吐量
对于大流量，动静分离，tomcat处理静态资源的能力比较差,交给nginx
缓存是重要的，把实时性要求不高的，或者能够忍受一段时间内的实时，缓存起来。

使用cdn缓存

1：框架用最熟悉的；
2：优化从最上层的业务逻辑开始；
3：硬件舍得投入。

跟框架没必然联系，另外直接使用serverlet对性能提高微乎其微。关健还在于负载均衡的多层次使用，缓存的合理使用，数据垂直和水平切分，异步方案，多系统间的同步，最后千万别忘了可用性。

框架对性能影响仍是很大的，若是部署到分布式架构上的话，系统不只性能获得了提高，容错性和可扩展性都会大大改善。前台能够用Tuscany进行逻辑划分，子系统分布到不一样的服务器上，后台可使用Hadoop进行分布式存储。可是分布式须要面临不少的技术问题：分布式缓存，分布式数据库等等，对技术人员要求较高。此外，还可使用nginx作负载均衡分发给tomcat。

框架对性能的影响微乎其微，Java的话挑熟悉的好用的就好了。更重要的是总体架构的设计、数据库的设计和优化、缓存系统等等。用Tomcat的话不要用Apache，小并发量还能用用，一旦请求多了会很麻烦，用Nginx。JVM特别是GC的调优也能够看看。

有几个经常使用的措施
一、对经常使用功能创建缓存模块
二、网页尽可能静态化
三、使用单独的图片服务器，下降服务器压力，使其不会由于图片加载形成崩溃
四、使用镜像解决不一样网络接入商和不一样地域用户访问差别
五、数据库集群图表散列
六、增强网络层硬件配置，硬的不行来软的。
七、终极办法：负载均衡

大流量，高并发的网站主要考虑的是可伸缩性，当用户量，流量增大的时候，能够经过增长机器来分担压力。。至于直接用不用servlet，这个看你的架构。。性能和复杂性通常都不能兼得。。

我的认为框架并不能为系统的性能获得多大的提高，框架可以帮助开发人员提升开发效率，滥用框架反而会致使系统性能的降低。
建议使用开发团队最熟悉的框架，关注代码自己，防止出现内存溢出的状况。
大流量，高并发的网站主要的压力应该是在数据库的io操做上，尽可能避免系统频繁请求数据库，优化查询语句，合理使用索引，减小sql语句执行的时间。
可使用一些缓存技术，如memcache，将频繁读取，不常常变化的数据放入缓存中。

面对大流量，高并发的问题，最好的方法是增长硬件投入。另外，我不认为servlet去处理底层数据是个明智的选择。servlet玩的就是request和response，处理和响应客户端请求为主。推荐一本书《构建高性能WEB站点》。

底层架构是指服务器吗？

服务器上的集群优化很重要的。
尝试下 Apache + Tomcat 吧。多个Tomcat集群，Apache作前端，负责静态内容。再加几台服务器，分别作memcached（多台）、数据库服务器。

Apache和Tomcat之间的沟通采用AJP协议，听说效率很高。

这么下来，这么多台服务器，足够撑不少用户了。

http://www.zhihu.com/question/19809311

-----------------------------------------------------------------------------------------------------------------------

先学测试吧。不是那种业务功能的测试，是系统的测试。由于要解决大数据量、高并发的问题，我我的的知识与经验是：

一、先用单机测试。用工具产生大并发量去轰击服务器，直至服务器缓慢，甚至接近崩溃；

二、在服务器艰难地工做的时候，用工具测试服务器，仔细分析，是什么使得服务器如此艰难，是 cpu ？是网络？仍是硬盘 io ？又或者是你的应用？数据库？

三、找到系统瓶颈后，优化，解决这个瓶颈，而后再循环测试。这时你又会发现新的瓶颈，再解决。循环1 - 3步，直到各方面基本平衡为止。

四、当单机没法解决问题的时候，接着开始考虑负载均衡，考虑分布式方案，而后再用 1 - 3 的步骤分析与测试。

最后，你的问题是，要学什么？答案就是：学要完成上述的步骤，解决其中产生的问题所涉及的各类知识。这不是一两本书能够讲得完的。

-----------------------------------------------------------------------------------------------------------------------

大流量: Varnish, Nginx, HAproxy

高并发: Node.js, Nginx, Redis, No-SQL

静态化，CDN

-----------------------------------------------------------------------------------------------------------------------

你须要了解大数据高并发的瓶颈在哪里，通常都是数据库层面的，机械硬盘承载不起很是快速的读写操做，cpu承载不起大量的逻辑运算，因此最基本的解决思路就是：
1.换固态硬盘加快硬盘的读写效率。
2.创建缓存中间件下降对硬盘的读写次数，缓存不用多说了，最最最基本和重要的优化策略。
3.将硬盘的读写或者数据的计算分摊到多台机器上，也就是集群。hadoop就是基于这个层面的。
4.良好的查询算法，下降读的次数，分表，分库，索引等都是基于这层面的。

理论上来说，在带宽充裕的状况下，只要遵循上面的4个思路进行延伸就能够解决大部分的高并发问题。

-----------------------------------------------------------------------------------------------------------------------

怎样学习才能拥有所谓“高并发”的经验？

这个问题彻底能够重定向到如何处理高并发业务场景. 如下只是我工做一年多接触到的一些基础,也许有误差,要具有高并发的经验确实须要有实际项目,由于业务逻辑其实很容易理清,可是要在高并发的状况下如何找到业务繁忙的热点并进行优化,彻底只能凭经验.
假如没有靠谱的公司,接触不到高并发的业务场景怎么办? 从处理技巧上,能够经过大牛学习高并发的架构,好比张宴:张宴的博客 - Web系统架构与底层研发.至少你能够知道处理高并发的业务逻辑是:

前端:异步请求+资源静态化+cdn
后端:请求队列+轮询分发+负载均衡+共享缓存
数据层:redis缓存+数据分表+写队列
存储:raid阵列+热备
网络:dns轮询+DDOS攻击防御

对于高并发并无什么通用解决方案,必须根据业务场景进行分析,不一样的业务场景对于架构的取舍是不同的.但万变不离其宗,掌握这些处理高并发的分析方法仍是颇有必要的.
如何学习高并发的工具? 处理高并发的开源轮子其实不少.不少高并发的架构分享都会说起使用的工具,本身多留心,再看看手册,有条件本身搭起来跑一跑. redis,nginx/Tengine,keeplive,DRBD,heartbeat这些小工具仍是能够在虚拟机上面多开几台跑起来的.至于大业务场景,除了进大公司没有别的办法,由于有些工具运行的配置要求过高,必须多台服务器配合才能完成.
如何模拟高并发场景? 并非只有实际生产环境才能测试高并发,其实模拟高并发的轮子也不少,最经常使用的apache benchmark,winrunner,loadrunner,这些教程不少,用来模拟基本的高并发业务绰绰有余,本身安装试用版,学学如何用,模拟些经常使用的业务. 若是有精力,业内很喜欢用perl,python,C来写一些针对热点业务的负载脚本.这须要有http协议等网络封包的理论基础.
一些建议 处理高并发要学习的东西实在太多.要在没有实际工做经验的状况下逐一了解太难,也很难深刻.对于高并发的学习,我建议除了多阅读高并发架构的文档学习基本的方法论之外,本身要去深刻学习网络基础,数据结构和算法.这些都是处理高并发热点的理论基础.

刘天斯：一例千万级pv高性能高并发网站架构

一个支撑千万级PV的网站是很是考验一个架构是否成熟、健壮(本文不涉及软件架构的层面，有兴趣也能够讨论)。现抛出一个系统层面的架构，不保证是最优的方案，但也许适合你。理由是再优秀的架构都不具有通用性，须要根据每种应用特色针对性来设计。但愿起到抛砖引玉的做用。

架构说明：

一、架构中直接引入软件名称的模块，是我的推荐使用的，如Haproxy、Hadoop等；

二、关于全局负载均衡，当作本投入状况，可使用商业的产品，如F5-GTM，开源方案即是自搭智能DNS；

三、本地负载均衡方案，能够考虑F5-LTM或成熟的开源解决方案LVS；

四、代理层为何推荐你们使用Haproxy？Haproxy是一个很是优秀的反向代理软件，十分高效、稳定。国内top 10的互联网公司都有在使用；

五、缓存层可使用Squid或Varnish，我的更倾向Varnish。配置灵活、运行稳定，提供很是便利的管理接口。为啥在缓存层前面加一层代理？优势很是多，列举以下：

根据应用配置URI路由规则，集中热点来提升后端缓存的命中率；
轻松划分网站频道、版块，更好对应用进步组织、规划；
对URI进行通常性安全过滤，抵御注入攻击；
弹性调配硬件资源，应对突发事件产生大流量；
可回收宝贵的公网IP资源；

六、应用层开源技术方案很是多且成熟，在此不详细描述；

七、数据库层主流开源解决方案Mysql是首选，主从复制（一主对多从）是目前比较靠谱的模式；

八、关于Nosql，应用场景很少说，可参考“给部门作的Mongodb技术交流PPT”文章，redis、memcached等做为热点数据存储、数据库缓存都很是理想；

九、内网DNS扮演的角色很是重要，必定要消灭code中出现的内网IP地址，很大程度减小因IP变动、服务器故障而修改源码的状况，同时也便于维护；

十、内网LB适用在内部WEB接口、多台数据库Slave、多台Nosql Slave、公共服务等应用的负载均衡，可使用LVS、Haproxy来实现，可用性要求不高的应用可行直接使用Localhost DNS轮询；

十一、hadoop适合海量数据的存储与处理，如作网站日志分析、用户数据挖掘等；

十二、管理集群，平台的核心，运维的阵地；

http://www.springload.cn/springload/detail/356

原文地址：http://www.javashuo.com/article/p-hycdlsok-bc.html