影响Java EE性能的十大问题

时间 2019-11-06

标签影响 java 性能十大问题栏目 Java 繁體版

原文原文链接

本文做者是一名有10多年经验的高级系统架构师，他的主要专业领域是Java EE、中间件和JVM技术。他在性能优化和提高方面也有很深入的看法，下面他将和你们分享一下常见的10个影响Java EE性能问题。 java

1.缺少正确的容量规划

容量规划是一个全面的和发展的过程标准，预测当前和将来的IT环境容量需求。制定合理的容量规划不只会确保和跟踪当前IT生产能力和稳定性，同时也会确保新项目以最小的风险部署到现有的生产环境中。硬件、中间件、JVM、调整等在项目部署以前就应该准备好。数据库

2.Java EE中间件环境规范不足

“没有规矩，不成方圆”。第二个比较广泛的缘由是Java EE中间件或者基础架构不规范。在项目初始，新平台上面没有制定合理的规范，致使系统稳定性差。这会增长客户成本，因此花时间去制定合理的Java EE中间件环境规范是必须的。这项工做应与初始容量规划迭代相结合。缓存

3.Java虚拟机垃圾回收过分

各位对“java.lang.OutOfMemoryError”这个错误信息是否是很熟悉呢？因为JVM的内存空间过分消耗（Java堆、本机堆等）而抛出的异常。安全

垃圾收集问题并不必定会表现为一个OOM条件，过分的垃圾收集能够理解成是JVM GC线程在短期里进行轻微或超量收集集合数据而致使的JVM暂停时间很长和性能降低。可能有如下几个缘由：性能优化

与JVM的负载量和应用程序内存占用量相比，Java堆可能选择的过小。
JVM GC策略使用不合理。
应用程序静态或动态内存占用量太大，不适合在32位JVM上使用。
JVM OldGen随着时间推移，泄漏愈来愈严重，而GC在几个小时或者几天后才发现。
JVM PermGen空间(只有HotSpot VM）或本机堆随着时间推移会泄露是一个很是广泛的问题；OOM的错误每每是观察一段时间后，应用程序进行动态调动。
YoungGen和OldGen的比例空间与你的应用程序不匹配。
Java堆在32位的VM上太大，致使本机堆溢出，具体能够表现为OOM试着去连接一个新的Java EE应用程序、建立一个新的Java线程或者须要计算本地内存分配任务。

建议：服务器

观察和深刻理解JVM垃圾回收。启动GC，根据健康合理的评估来提供全部的数据。
记住，GC方面的相关问题不会在开发中或者功能测试时发现，它须要在多用户高负载的测试环境下发现。

4.与外部系统集成过多或过少

致使Java EE性能差的第四个缘由是高分布式系统，典型案例是电信IT环境。在这个环境中，一个中间件领域（例如，服务总线）不多会作全部的工做，而仅仅是把一些业务“委托”给其余部分，例如产品质量，客户资料和订单管理，到其余Java EE中间件平台或遗留系统中，如支持各类不一样的负载类型和通讯协议的大型机。网络

这样的外部系统调用意味着客户端的Java EE应用程序触发建立或重用套接字连接从外部系统中读写数据。根据业务流程的实施和实现能够配置成同步调用或异步调用。须要注意的是，响应时间会根据外部系统的稳定情况进行改变，因此经过适当的使用超时来保护Java EE应用程序和中间件也是很是重要的。架构

下面这3种状况是常常出现问题和性能下降的地方：异步

同步和相继调用太多的外部系统。
在Java EE客户端应用程序和外部系统之间连接超时，使数据丢失或者值过高致使客户端线程被卡住，从而致使多米拉效应。
超时，但程序仍正常执行，但是中间件不处理这种奇怪的路径。

最后，建议多进行负面测试，这意味着须要“人为”创造产生这些问题的条件，用来测试应用程序和中间件之间是如何处理外部系统错误。分布式

5.缺少适当的数据库SQL调优和容量规划

你们可能会对这一个感到惊奇：数据库问题。大多数Java EE企业系统是依赖关系型数据库处理复杂的业务流程。一个基础扎实稳固的数据库环境能够确保IT环境有规模的增加，来支持日益不断扩大的业务。

在实际中，与数据库相关的性能问题是很常见的。因为多数数据库事务处理都是由JDBC数据源执行的（包括关系持久化API，例如Hibernate）。而性能问题最初都会表现为线程阻塞。

如下是我在10年的工做中，常常出现的关于数据库方面的问题（以Oracle数据库为例）：

孤立的，长时间运行的SQL。主要表现为线程阻塞、SQL没有进行优化、缺乏索引、非最佳的执行计划、返回大量数据集等等。
表或行级数据锁定。当提交一个双阶段事务模型时（例如，臭名昭著的Oracle可疑事务）。Java EE容器可能会留下一些未处理的事务等待最后的提交或回滚，留下的数据锁能触发性能问题，直到最后的锁被移除。例如中间件断电或者服务器崩溃均可能引发这些状况发生。
缺少合理规范的数据库管理工具。例如Oracle里面的REDO logs，数据库数据文件等。磁盘空间不足，日志文件不旋转等都会触发较大的性能问题和断电状况。

建议：

合理的容量规划，包括负载和性能测试都是必不可少的，优化数据环境和及时发现问题。
若是是使用Oracle数据库，确保DBA团队按期审查AWR报告，尤为是在上下关联的事件和根源分析过程当中。
使用JVM线程存储和AWR报告查明SQL运行缓慢的缘由或者使用监控工具来作。
增强“操做”方面的数据库环境（磁盘空间、数据文件、重作日志、表空间等）以适当的监视和报警。若是不这么作，会让客户端IT环境出现较多的断电状况和花许多时间进行故障调修。

6.特定应用程序性能问题

下面关注的是比较严重的Java EE应用程序问题。关于特定应用程序性能问题，总结了如下几个点：

线程安全的代码问题
通讯API缺乏超时设置
I/O、JDBC或者关系型API资源管理问题
缺少适当的数据缓存
数据缓存过分
过多的日志记录

7.Java EE中间件调优问题

通常Java EE中间件都已经够用了，只是缺乏必要的优化。大多数Java EE容器都能有多种方案供你的应用程序和业务进程选择。

若是没有进行适当的调整和实践，那么Java EE容器可能会处于一种消极的状态。下图是视图和检查列表示例：

8.主动监控不足

缺少监控，并不会带来实际性能问题，但它会影响你对Java EE平台性能和健康情况的了解。最终，这个环境能够达到一个破发点，这可能会暴露出一些缺陷和问题(JVM的内存泄漏，等等)。

以个人经验来看，若是一开始不进行监控，而是运行几个月或者几年后再进行，平台稳定性将大打折扣。

也就是说，改善现有的环境永远都不会晚。下面是一些建议：

复查现有Java EE环境监测能力和找到需改进的地方。
监测方案应该尽量的覆盖整个环境。
监控方案应该符合容量规划进程。

9.公共基础设施硬件饱和

这个问题常常在有太多的Java EE中间件环境随着JVM进程被部署到现有硬件上面时看到。太多的JVM进程对有限的物理CPU核心来讲是一个真正的程序性能杀手。另外，随着客户端业务的增加，硬件方面也须要再次考虑。

10.网络延迟

最后一个影响性能问题的是网络，网络问题时不时的都会发生，如路由器、交换机和DNS服务器失败。更常见的是在一个高度分散的IT环境中按期或间歇性延迟。下面图片中的例子是一个位于同一区域的Weblogic集群通讯与Oracle数据库服务器之间的延迟。

间歇或按期的延迟会触发一些重要的性能问题，以不一样的方式影响Java EE应用程序。

由于大量的fetch迭代（网络传入和传出），涉及大数据集的数据查询问题的应用会很是受网络延迟的影响
应用程序在处理外部系统大数据负载（例如XML数据）时也会很受网络延迟的影响，会在发送和接收响应时产生巨大的响应间隔。
Java EE容器复制过程（集群）也会受到影响，而且会让故障转移功能（如多播或单播数据包损失）处于风险中。

JDBC行数据“预取”、XML数据压缩和数据缓存能够减小网络延迟。在设计一个新的网络拓扑时，应该仔细检查这种网络延迟问题。

但愿本文可以帮助您理解一些常见的性能问题和压力点，每一个IT环境都是独一无二的，因此文中提到的问题不必定会是您遇到的，您能够把您遇到的问题拿出来和你们一块儿分享一下！