面向.Net程序员的后端性能优化实战

时间 2019-11-07

标签面向程序员后端性能优化实战栏目快乐工作繁體版

原文原文链接

最近2个月没作什么新项目彻底是对于旧的系统进行性能优化避免超时死锁数据处理能力不够等常见的性能问题html

这里不从架构方面出发毕竟动大手脚成本比较高那么咱们以实例为前提从细节开始 java

优化角度程序员

一.业务逻辑优化sql

二.DB优化数据库

三.数据处理优化c#

四.锁与性能安全

五.cpu飙高小结性能优化

六.crash现象分析服务器

业务逻辑优化

这一条不具备广泛性不一样的业务不一样的场景若是概括起来就是在不影响业务的前提下进行流程精简多线程

1. 废弃冗余逻辑

常见于各类基于数据库的检查不少同窗在维护别人代码的时候没有深刻理解别人的逻辑也许别人在取数据的时候已经在查询条件中已通过滤了相关逻辑然后来维护的同窗又来了一次check

固然若是处于数据安全的角度 double check无可厚非，可是若是连锁都没有的double check 其实不作也罢。

毕竟省一次dbcall 可能效果胜于你作的N多优化

2. 合并业务请求

出发点和上述一致节省dbcall 可是存在一个矛盾的点若是业务包在事务里这条须要慎重考虑事务的设计原则里固然能小则小

DB优化

这个实际上是比较核心的点

1. 索引优化

这个点比较泛泛可是作好的人很少一个专攻于索引优化的人也能够在运维方面独当一面了

咱们拿实例来看一个索引优化例子

首先利其器选中你须要的调试信息

而后打开自动统计信息更新特别对于测试阶段数据以及数据量频繁变动的时候统计信息必定要记得刷新

　　建立索引时，查询优化器自动存储有关索引列的统计信息。另外，当 AUTO_CREATE_STATISTICS 数据库选项设置为 ON（默认值）时，数据库引擎自动为没有用于谓词的索引的列建立统计信息。随着列中数据发生变化，索引和列的统计信息可能会过期，从而致使查询优化器选择的查询处理方法不是最佳的。当 AUTO_UPDATE_STATISTICS 数据库选项设置为 ON（默认值）时，查询优化器会在表中的数据发生变化时自动按期更新这些统计信息。每当查询执行计划中使用的统计信息没有经过针对当前统计信息的测试时就会启动统计信息更新。采样是在各个数据页上随机进行的，取自表或统计信息所需列的最小非汇集索引。从磁盘读取一个数据页后，该数据页上的全部行都被用来更新统计信息。常规状况是：在大约有 20% 的数据行发生变化时更新统计信息。可是，查询优化器始终确保采样的行数尽可能少。对于小于 8 MB 的表，则始终进行完整扫描来收集统计信息。

最后执行 SET STATISTICS PROFILE ON,能够看到更详细的计划

随便拿个典型sql来做示例相关值为虚假值仅供参考

SELECT DISTINCT TOP 1000 a.CustomerID FROM TravelTicket(nolock) a
WHERE  a.TicketChargeDate < GETDATE()
AND a.AvailableAmount > 999
AND a.[Status] <>999
AND a.IsInCome <>999
AND a.IsInCome <>998 
AND NOT EXISTS 
(SELECT TOP 1 1 FROM TicketCharge(NOLOCK) b 
	WHERE   b.CustomerID = a.CustomerID
                AND b.chargetype = 999
		AND b.IsSuccessful = 999
		AND b.IsDeleted != 999
		AND b.FeeMonth = '999'

)

在彻底没有任何索引的前提下咱们查询一遍看下各类io信息以及执行计划

如图中所示存在2个汇集索引扫描先介绍下基础知识

【Table Scan】：遍历整个表，查找全部匹配的记录行。这个操做将会一行一行的检查，固然，效率也是最差的。
【Index Scan】：根据索引，从表中过滤出来一部分记录，再查找全部匹配的记录行，显然比第一种方式的查找范围要小，所以比【Table Scan】要快。
【Index Seek】：根据索引，定位（获取）记录的存放位置，而后取得记录，所以，比起前二种方式会更快。
　　在有汇集索引的表格上，数据是直接存放在索引的最底层的，因此要扫描整个表格里的数据，就要把整个汇集索引扫描一遍。在这里，汇集索引扫描【Clustered Index Scan】就至关于一个表扫描【Table Scan】。所要用的时间和资源与表扫描没有什么差异。并非说这里有了“Index”这个字样，就说明执行计划比表扫描的有多大进步。固然反过来说，若是看到“Table Scan”的字样，就说明这个表格上没有汇集索引。换句话说上面那段sql存在2个表扫描。

【Clustered Index Seek】：直接根据汇集索引获取记录，最快！

因此咱们优化的目标是将扫描(scan)变为查找(seek)

　　先来尝试TicketCharge表下面咱们所新添而且讨论的索引都是非汇集索引

　　江湖上流传着这么一篇秘诀，建符合索引根据where查询的顺序来，好吧咱们姑且先尝试一下

/****** Object:  Index [rgyu_test1]    Script Date: 2015-2-2 17:52:50 ******/
CREATE NONCLUSTERED INDEX [chongzi_test] ON [dbo].[TicketCharge]
(
	[CustomerID] ASC,
	[ChargeType] ASC,
	[IsSuccessful] ASC,
	[IsDeleted] ASC,
	[FeeMonth] ASC
)WITH (PAD_INDEX = OFF, STATISTICS_NORECOMPUTE = OFF, SORT_IN_TEMPDB = OFF, DROP_EXISTING = OFF, ONLINE = OFF, ALLOW_ROW_LOCKS = ON, ALLOW_PAGE_LOCKS = ON) ON [PRIMARY]
GO
ALTER INDEX [chongzi_test] ON [dbo].[TicketCharge] DISABLE
GO

　　再看看新的执行计划

　　没变！江湖秘诀果真仍是得慎重点用，咱们来分析下索引没命中的缘由。

第一块是索引基本信息

列名	描述说明
Name	统计信息对象名称
Update	上一次更新统计信息的日期和时间
Rows	在目标索引、统计信息或列中的总行数。若是筛选索引或统计信息，此行数可能小于表的行数。
Rows Sampled	用于统计信息计算的抽样总行数。
Steps	统计信息对象第一个键列的直方图中的值范围数。每一个步骤包括在直方图结果中定义的 RANGE_ROWS 和 EQ_ROWS。
Density	查询优化器不使用此值。显示此值的惟一目的是为了向后兼容。密度的计算公式为 1 / distinct rows，其中 distinct rows 是直方图输出中全部步骤的 DISTINCT_RANGE_ROWS 之和。若是对行进行抽样，distinct rows 则基于抽样行的直方图值。
Average Key Length	统计信息对象的键列中，全部抽样值中的每一个值的平均字节数
String Index	若是为“是”，则统计信息中包含字符串摘要索引，以支持为 LIKE 条件估算结果集大小。仅当第一个键列的数据类型为char、varchar、nchar、nvarchar、varchar(max)、nvarchar(max)、text 或 ntext 时，才会对此键列建立字符串索引。
Filter Expression	包含在统计信息对象中的表行子集的表达式。NULL = 未筛选的统计信息。有关详细信息，请参阅筛选统计信息。
Unfiltered Rows	应用筛选器表达式前表中的总行数。若是 Filter Expression 为 NULL，Unfiltered Rows 等于行标题值。

　第二块对指定 DENSITY_VECTOR 时结果集中所返回的列进行了说明。

列名	说明
All Density	针对统计信息对象中的列的每一个前缀计算密度（1/ distinct_rows）。
Average Length	每一个列前缀的列值向量的平均长度（按字节计）。例如，若是列前缀为列 A 和 B，则长度为列 A 和列 B 的字节之和。
Columns	为其显示 All density 和 Average length 的前缀中的列的名称。

第三块对指定 HISTOGRAM 选项时结果集中所返回的列进行了说明。

列名	说明
RANGE_HI_KEY	直方图步骤的上限值。
RANGE_ROWS	表中位于直方图步骤内（不包括上限）的行的估算数目。
EQ_ROWS	表中值与直方图步骤的上限值相等的行的估算数目。
DISTINCT_RANGE_ROWS	直方图步骤内（不包括上限）非重复值的估算数目。
AVG_RANGE_ROWS	直方图步骤内（不包括上限）重复值的频率或平均数目（若是 DISTINCT_RANGE_ROWS > 0，则为 RANGE_ROWS / DISTINCT_RANGE_ROWS）。

越小的SQL Server索引密度意味着具备更高的索引选择性。当密度趋近于1，索引就变得有更少的选择性，基本上没有用处了。当索引的选择性低的时候，优化器可能会选择一个表扫描（table scan），或者叶子级的索引扫描（Index scan），而不会进行索引查找（index seek），由于这样会付出更多的代价。小心你的数据库中低选择性的索引。这样的索引一般是对系统的性能是一个损害。它们一般不只不会用来进行数据的检索，并且也会使得数据修改语句变得缓慢，由于须要额外的索引维护。识别这些索引，考虑删除掉它们。

而上图咱们的密度已经达到0.33，由于这不是一个好的方案。咱们调整索引顺序，将feemonth提到第一列。

再看执行io和执行计划

搞定，咱们再看下统计分析

到此为止或许你觉得已经搞定了这个索引问题 ticketcharge的读取从1w3下降到了13 可是友情提请一下密度会随着数据分布的变化而变化本次的demo数据具备特殊性具体的问题还须要具体来分析

咱们看一下更详细的计划

另外针对本文这种sql写法还有另一个点须要关注那就是索引第一列不能够是于第一张表关联的列

调整咱们的索引顺序一样可让sql命中索引咱们来看下效果

执行一下

虽然命中了索引可是因为关联键的问题致使ticketcharge进行了循环。

因此说江湖上流传的按照where查询条件设计索引顺序是彻底错误的第一列的选择要根据密度选择性来判断

另外非汇集索引列分为键值列和包含列(include)

复合索引的键值列不是越多越好，首先索引自己有长度的限制。可是使用非键值列就不算在索引长度内。键列存储在索引的全部级别中，而非键列仅存储在叶级别中。简单来讲原本索引相似于字典的部首查找，你根据部首查找之后还要根据该汉字对应的页数去查看详细，可是若是你只是要一个简单的该汉字的拼音，那么包含列至关于把拼音直接附加在部首查找后面，你就不须要再去详细页查看其它你不须要的信息了。

换个角度来讲，当查询中的全部列都做为键列或非键列包含在索引中时，带有包含性非键列的索引能够显著提升查询性能。这样能够实现性能提高，由于查询优化器能够在索引中找到全部列值；不访问表或汇集索引数据，从而减小磁盘 I/O 操做。

至于travelticket的索引设计也相似，不过须要注意的点是不等于运算以及like运算都是不能使用索引的。须要结合业务来调整。

除了上述人为的添加索引还有一种取巧的办法

　　打开sql server profiler

　　按照本身的需求新建一个跟踪脚本

　　写个脚本循环跑这个语句而后保存跟踪脚本。打开推荐sql优化器

　　导入刚才的跟踪脚本，而且选择索引优化

　　执行分析

数据处理优化

　　对于db优化在程序员能力已经到瓶颈的前提下，能够着手从应用程序上的细节出发，例如并行。

　　所谓并行也就是多线程针对同任务分区分块协同处理。多线程的技术你们都很了解，这里突出如下线程同步的问题。例如我有1000我的我分10组任务执行，如何正确的保证当前10组任务正确的完成互相不冲突而且等到全部任务完成后才开启下一轮1000.

　　这里介绍一个比较通用的方法，首先申明一个信号量队列List<ManualResetEvent>()；

　　取出1000条后对于1000条进行添加顺序标识表示而且模余分组。标识从1开始递增就能够，模余分组方法以下

　　testInfos.GroupBy(i => i.index % workTaskCount).Select(g => g.ToList()).ToList();

　　其中index为刚才添加的顺序标识， workTaskCount为分组的任务数。

//循环处理批次任务
foreach (var testGroup in testGroups)
{
    var mre = new ManualResetEvent(false);
    manualEvents.Add(mre);
    var testMethodParam = new TestMethodParam
    {
        mrEvent = mre,
        testGroup = TestGroup,
        testParam = testParam
    };
    //线程池处理计划任务
    ThreadPool.QueueUserWorkItem(DoTestMethod, testMethodParam);
}
if (manualEvents.Count != 0)
{
    //等待全部信号量完成 切记这里最大值为64
    WaitHandle.WaitAll(manualEvents.ToArray(), 30 * 60 * 1000);
}

　　DoTestMethod就是旧的任务处理逻辑，testMethodParam负责涵盖你旧逻辑中所须要的参数而且包含一个完成信号量。

　　这里须要牢记的是WaitHandle等待的信号量最大值为64.

　　若是你须要的任务分组数超过64那么这里推荐在DoTestMethod方法中不适用信号量，而是使用原子操做的标识，例如Interlocked.Increment(taskCount)。当taskCount累加到1000（你设计的当前批次值）就结束一轮。不过比起WaitHandle性能上要慢一些。

　　另外若是你使用线程池来管理线程，最好加上最大线程限制。过多的线程是致使cpu资源消耗的缘由之一，最好的线程数是服务器cpu个数的2倍-1或者-2，

死锁问题

　　锁超时的问题大可能是由于表锁产生。解决表锁的问题说难也不难，不过须要牺牲性能。mssql针对主键的更新不会产生表锁而是产生行锁。针对这个问题那么死锁的问题初步解决起来就简单了。

　　这是比较通用的处理方法

DECLARE @step INT 
DECLARE @id CHAR(12)
create table #tmpTest  --建立临时表
(
	rec_index INT ,
	id CHAR(12)
);
INSERT INTO #tmpTest  (rec_index,ID) 
SELECT ROW_NUMBER() OVER(ORDER BY ID) AS rec_index,ID FROM TestTable(nolock) WHERE BID = @bID
SET @rowcount=0
SET @step=1
SELECT @rowcount=COUNT(*) FROM #tmpTest AS tt
WHILE(@step<=@rowcount)
BEGIN
	SELECT @id=Id
	FROM #tmpTest  AS tt
	WHERE @step=rec_index
	UPDATE TestTable
    SET
		UpdateUser = @UpdateUser,
		UpdateTime = @UpdateTime,
	WHERE  ID =@id
	SET @step=@step+1
END

cpu飙高小结

对于cpu飙高分2类，应用服务器和db服务器的飙高缘由优先排查点不一样

对于应用服务器，首先排查while true等死循环，其次看多线程问题。不排除其余缘由，这里只介绍主要的状况

在本机就能够根据源代码来调试

如图所示咱们的cpu问题是因为线程过得多致使由于个人demo用的Threadpool因此一个简单的ThreadPool.SetMaxThreads(5, 5);便可搞定.

若是上述状况检查不出你的程序致使cpu飙高的缘由，那么就须要借助于其余工具例如dotTrace.

根据本身的程序类型加载不一样的探查器

截图不具备典型性操做很简单没有什么过多值得介绍的官方文档

http://www.jetbrains.com/profiler/features/index.html

咱们随便找个程序

下面咱们看看db服务器cpu飙高的一些缘由。

最大的一个坑是隐式数据类型转换,之因此为坑是由于他不是显示的出现问题，而是当你的数据分布以及量达到必定条件后才会产生问题。

什么是隐式数据类型转换：

当咱们在语句的where 条件等式的左右提供了不一样数据类型的列或者变量，SQL Server在处理等式以前，将其中一端的数据转换成跟另外一端数值的数据类型一致，这个过程叫作隐式数据类型转换。

好比 char(50)=varchar(50), char(50)=nchar(50), int=float, int=char(20) 这些where 条件的等式都会触发隐式数据类型转换。

可是，对于某些数据类型转换过程当中，能够转换的方向只是单向的。例如：

若是你试图比较INT和FLOAT的列，INT数据类型必须被转换成FLOAT型 "CONVERT(FLOAT,C_INT) = C_FLOAT".

若是你试图比较char和nchar的列，char数据类型必须被转换成unicode型 "CONVERT(nchar,C_char) = C_nchar"

所以，咱们在.net 或者java的程序中，会常常出现因为隐式数据类型转换而产生的性能问题。

最简单的咱们来作个试验

CREATE TABLE [Chongzi_Test] (
[TAB_KEY] [varchar] (5)  NOT NULL ,
[Data] [varchar] (10)  NOT NULL ,
CONSTRAINT [Chongzi_Test_PK] PRIMARY KEY  CLUSTERED 
(
[TAB_KEY]
)  ON [PRIMARY] 
) ON [PRIMARY]
GO

而后插入几百条数据

咱们执行

declare @p1 int
set @p1=0
exec sp_prepexec @p1 output,N'@P0 varchar(5)',N'select TAB_KEY,Data from Chongzi_Test where TAB_KEY = @P0',N'0'
select @p1

而后咱们换一种不匹配类型来看一下

declare @p1 int
set @p1=0
exec sp_prepexec @p1 output,N'@P0 nvarchar(4000)',N'select TAB_KEY,Data from Chongzi_Test where TAB_KEY = @P0',N'0'
select @p1

这里出现了一个操做叫作GetRangeThroughConvert(),在这里，SQL Server因为不能直接对varchar(5)的列用nvarchar(4000)的值进行seek，所以，SQL Server必须将nvarchar转换成varchar。

这个过程当中不一样的应用场景能够带来性能的损耗可能会很大，由于在转换过程当中可能会存在表扫描。

例如以前项目中有个nvarchar(max)向varchar(50)转换，因为包含有特别的字符，如全双工字符＜，该字符直接转换成varchar(50)不会那么顺利。须要根据参数的实际长度和表结构中定义的字段长度进行比较，若是小于表结构中定义的字段长度，Range依旧会比较小，可是若是大于表结构中定义的字段长度，GetRangeMismatchedTypes函数会把Range设得很宽，查询很慢。

如图执行计划是同样的，返回数据行不一样。

附上c# dbtype 与sql 类型的对应表

AnsiString:VarChar
Binary:VarBinary
Byte:TinyInt
Boolean:Bit
Currency:Money
Date:DateTime
DateTime:DateTime
Decimal:Decimal
Double:Float
Guid:UniqueIdentifier
Int16:SmallInt
Int32:Int
Int64:BigInt
Object:Variant
Single:Real
String:NVarChar
Time:DateTime
AnsiStringFixedLength:Char
StringFixedLength:NChar
Xml:Xml
DateTime2:DateTime2
DateTimeOffset:DateTimeOffset

Crash现象分析

目前仍是用老办法抓dump分析堆栈

使用过程能够参考我以前的博文 http://www.cnblogs.com/dubing/p/3878591.html