基于Java技术的大型网站架构方案(转)


一、Web层
主体架构能够基于 Struts 1.X/2.X,固然有不少更好的控制层框架供选择,以快速敏捷为准则吧。 
抽象出核心库封装 控制器和中间层的操做。 
在大规模集群环境下,session复制会引发严重的性能问题。考虑用 集群缓存 + cookie验证 代替session实现权限控制吧。 
二、Cache层
配置 Memcache 组成集群缓存 
对 Memcache 客户端进行封装 
Memcached 节点组成池,调用示意:opList (BizName, 策略 ...)
三、中间层
“中间层”能够理解为基于应用和数据之间的层次。它被设计用来为Web应用提供:数据缓存 和 对应用透明的数据访问——即应用不须要考虑数据表拆分的问题。以服务的方式提供对存储层的高性能调用以及分布式计算。可供选择的框架:ICE 、Hadoop 直接基于Memcache开发(减小复杂度,推荐) 
四、存储
推荐MySQL,理由:免费,通过实践检验,有大量成熟的案例、解决方案、技术支持。
小规模:一个 data table 维护存储服务器阵列,内容 -> mount …… 
大规模:Master-Slave模式+MySQL Proxy,实现数据库读写分离。在中间层的包装下,可作以下扩展,以支持更大规模的数据存取: 
数据库/表水平拆分,例 User -> User33% + User33% + User34% 
数据库/表垂直拆分,例 User -> UserBaseInfo + UserAddrInfo 
也可考虑使用 LongStore (龙存) 解决方案,由龙存管理存储阵列……
五、部署
划分子域名,每一个子域名一个Web应用包,互不干扰 
静态资源(css, js, image ...)使用专门的静态服务器 
六、负载均衡
小规模:DNS轮询。
大规模:F5, 2*X 台F5服务器,F5是L4/L7层交换机,每台至少可处理200万链接(与服务器内存有关)。
Ngnix是L7层交换,LVS负载均衡也是一种方案
七、Web中间件选择
Tomcat - 最高400并发 
Apache - 最高2000并发 
Ngnix - 优于Apache 
采用方案:Ngnix + Resin ,理由:
Resin提供更为快速的servlet引擎 - 选择Resin。 
gzip问题 - Resin在单独处理gzip时存在内存溢出的隐患,所以要加一层 Ngnix。 
Ngnix 能减小单独使用Resin时的内存占用 - Resin创建1000个链接使用1000个线程;加Ngnix后,透过其“异步链接”、“创建长链接”机制使Resin内存压力大大减少。 
Ngnix 针对Linux系统有性能优化措施 - 0 Copy, send file ... 
所以采用:1 Ngnix + 1 Resin,一对一。
静态服务器采用:Squid + Apache, why? because Squid has cache ability ...
新变化 - Nginx从0.7.48版本开始,支持了相似Squid的缓存功能。这个缓存是把URL及相关组合看成Key,用md5编码哈希后保存在硬盘上,因此它能够支持任意URL连接,同时也支持 404/301/302 这样的非200状态码。虽然目前官方的Nginx Web缓存服务只能为指定URL或状态码设置过时时间,不支持相似Squid的PURGE指令,手动清除指定缓存页面,可是,经过一个第三方的Nginx模块,能够清除指定URL的缓存。
Nginx的Web缓存服务主要由proxy_cache相关指令集和fastcgi_cache相关指令集构成,前者用于反向代理时,对后端内容源服务器进行缓存,后者主要用于对FastCGI的动态程序进行缓存。二者的功能基本上同样。
最新的Nginx 0.8.31版本,proxy_cache和fastcgi_cache已经比较完善,加上第三方的ngx_cache_purge模块(用于清除指定URL的缓存),已经能够彻底取代Squid。有的网站已经在生产环境使用了 Nginx 的 proxy_cache 缓存功能超过两个月,十分稳定,速度不逊于 Squid。
在功能上,Nginx已经具有Squid所拥有的Web缓存加速功能、清除指定URL缓存的功能。而在性能上,Nginx对多核CPU的利用,赛过Squid很多。另外,在反向代理、负载均衡、健康检查、后端服务器故障转移、Rewrite重写、易用性上,Nginx也比Squid强大得多。这使得一台Nginx能够同时做为"负载均衡服务器"与"Web缓存服务器"来使用。如下是配置片断供参考:
view plaincopy to clipboardprint?
http    
{   
  ...   
  client_body_buffer_size  512k;   
  proxy_connect_timeout    5;   
  proxy_read_timeout       60;   
  proxy_send_timeout       5;   
  proxy_buffer_size        16k;   
  proxy_buffers            4 64k;   
  proxy_busy_buffers_size 128k;   
  proxy_temp_file_write_size 128k;   
  ...  
  #注:proxy_temp_path和proxy_cache_path指定的路径必须在同一分区   
  proxy_temp_path   /data0/proxy_temp_dir;  
  #设置Web缓存区名称为cache_one,内存缓存空间大小为200MB,1天清理一次缓存,硬盘缓存空间大小为30GB。   
  proxy_cache_path  /data0/proxy_cache_dir  levels=1:2   keys_zone=cache_one:200m inactive=1d max_size=30g;   
}   
server   
{   
  ...   
  location /   
  {  
    #若是后端的服务器返回50二、50四、执行超时等错误,自动将请求转发到upstream负载均衡池中的另外一台服务器,实现故障转移。   
    proxy_next_upstream http_502 http_504 error timeout invalid_header;   
    proxy_cache cache_one;  
    #对不一样的HTTP状态码设置不一样的缓存时间   
    proxy_cache_valid  200 304 12h;   
    proxy_cache_valid  301 302 1h;  
    #以域名、URI、参数组合成Web缓存的Key值,Nginx根据Key值哈希,存储缓存内容到二级缓存目录内   
    proxy_cache_key $host$uri$is_args$args;   
    proxy_set_header Host  $host;   
    proxy_set_header X-Forwarded-For  $remote_addr;   
    proxy_pass http://backend_server;   
    expires      1d;   
  }  
  #用于清除缓存,假设一个URL为http://192.168.1.44/test.txt,经过访问http://192.168.4.44/purge/test.txt就能够清除该URL的缓存。   
  location ~ /purge(/.*)   
  {  
    #设置只容许指定的IP或IP段才能够清除URL缓存。   
    allow            127.0.0.1;   
    allow            192.168.0.0/16;   
    deny            all;   
    proxy_cache_purge    cache_one   $host$1$is_args$args;   
  }      
  #扩展名以.php、.jsp、.cgi结尾的动态应用程序不缓存。   
  location ~ .*\.(php|jsp|cgi)?$   
  {   
    proxy_set_header Host  $host;   
    proxy_set_header X-Forwarded-For  $remote_addr;   
    proxy_pass http://backend_server;   
  }   
php

同时,对于影响页面展示的静态资源,例如:css, js 等能够放在具备优质带宽的IDC(IDC=互联网数据中心,优质/高速的带宽也比较贵,正所谓一份价钱一分货);其余的静态资源,如图片等能够放在价格相对低廉的IDC中,以域名区分两种静态资源,节省每一分钱。
八、网络拓扑图
         / Ngnix - 1:1 - Resin 
F5 --
         \ Squid - 1:n - Apachecss

九、监控统计平台
业务统计 - 用户访问统计 
软件性能 - 应用系统监控,例如:请求响应时间…… 
硬件/网络性能 - Ganglia监控 
十、其它要点
IE浏览器对同一域名(包括子域名)只能创建2个链接,链接多了只能排队…… 
双F5架构,两台职能划分不一样,镜像,心跳接管…… 
Raid存储阵列…… 
Linux操做系统及其优化……数据库

相关文章
相关标签/搜索