关于join时显示no join predicate的那点事

时间 2019-11-20

标签关于 join 显示 predicate 那点栏目 SQL 繁體版

原文原文链接

咱们偶尔，很是偶尔的状况下会在一个查询计划中看到这样的警告：算法

大红叉，好吓人啊！sql

把鼠标放上去一看显示这样的信息app

No join predicateide

直译过来就是：没有链接谓词oop

在真实的生产环境下咱们不多能看到这种警告，何时才出这种警告呢？固然就是~~~没有链接谓词（汗）的时候，也许这么解释起来很找打，可是真实状况就是这样。sqlserver

咱们知道，在sqlserver链接操做的时候，他的本质实际上就是生成一个笛卡尔积表，那么链接谓词就是在笛卡尔积表上进行筛选的条件性能

好比咱们写以下的查询：测试

select sod.ProductID from sales.SalesOrderDetail sod
join production.product pd
on 1=1大数据

能够看到，我在on的位置上只写了on 1=1，实际上这个查询等同于优化

select sod.productid from
sales.SalesOrderDetail sod ，production.product pd

where 1=1--或者where 1=1这个能够也是能够不加的

咱们都知道上面两种写法只是生成了一个笛卡尔积表的全集

他们的执行计划生成是如出一辙的，以下,能够注意一下上方显示的查询语句：

这时，由于两个表之间出现了没有任何可供链接的谓词，换句话说就是没有对笛卡尔积生成的表进行任何筛选，这种查询可能会带来巨大的性能损耗，因此发出了no join predicate的警告，而事实也是如此

咱们能够看到12W对500条数据的表作积后生成的数据量高达6KW条，可想而知这种查询的消耗有多么大，因此咱们通常在查询中必定要注意在作表链接的时候避免这种写法，也许有人会说，谁会这么写查询？我只能说什么均可能发生，好比链接表时是以拼串的形式生成的sql语句，或者用我提到的第二种古老的写法进行的查询，都是有可能的。

OK，以上是对no join predicate警告的一个基本说明，可是今天咱们的重点不在这里

我这篇文章想说的是：有一种状况下的警告出现的很奇怪，好比下面这个查询

SELECT sod.SalesOrderID,pd.Name FROM sales.SalesOrderDetail sod
INNER JOIN production.product2 pd
on sod.productid=pd.ProductID
where sod.productid=777

计划：

这个计划中就有无链接谓词警告，可是明明写了ON也有where条件，为何还会生成这样的计划呢，咱们来看一下它是怎么产生的：

咱们以最开始的查询开始

注意：product 表就是AdventureWorks2008R2原生的产品表

SELECT sod.SalesOrderID,pd.Name FROM sales.SalesOrderDetail sod
INNER JOIN production.product pd
on sod.productid=pd.ProductID
where sod.productid=777

它的计划以下：

OK，没有任何的问题，那么咱们假设有以下状况：product 表中的productID并不惟一，也就是说SalesOrderDetail 和product 的productid是多对多的状况，这种状况在生产环境中就至关常见了

因此我生成了以下的表:select * into Production.product2 from Production.product

咱们知道，这样生成的表会把identify列一块儿生成，上面说过productid应该是不惟一的状况，因此咱们把idenify属性去除（过程省略），并生成一个不惟一索引

为这说明以后发生的问题，咱们再添加一个列，显示的是产品第一批订单发生的日期

alter table Production.product2 add firstorder int

update Production.product2 set firstorder=c.SalesOrderDetailID
from Production.product2 a
cross apply(select top 1 SalesOrderDetailID from Sales.SalesOrderDetail
where ProductID=a.ProductID order by ModifiedDate) c

再建立一个索引

create index IX_test on Production.product2 (productid,firstorder，name)

以后运行：

SELECT sod.SalesOrderID,pd.Name FROM sales.SalesOrderDetail sod
INNER JOIN production.product2 pd
on sod.productid=pd.ProductID
where sod.productid=777 option(recompile)

再查看执行计划

好的，仍是没有任何问题出现，咱们知道，查询计划的生成是依靠统计信息的，因此咱们查看一下777这个键值的统计信息：

DBCC SHOW_STATISTICS("Production.product2",IX_test)

能够看出，777这个值显示为一个惟一值（或者说mssql经过统计信息认为777这个值也许，大概，多是惟一的），以前咱们说过，咱们的场景是多对多，那咱们开始生成重复数据，而且手动刷新统计信息：

insert into Production.product2 select * from Production.product2 where productid=777

update STATISTICS Production.product2 IX_test with fullscan—在sql2014中因为预估算法有改进，不用更新统计直接执行也能够重现，可是在直方图中就看不出来了

再看上面查询的计划

噢！变成没有谓词的提示了！

统计信息呢，变成这样了

这是为何呢？

解释以下：咱们知道，在查询处理的过程当中，优化器对查询有一系列简化过程，好比代数代入，就是说在

on sod.productid=pd.ProductID
where sod.productid=777

这个条件下，会先经过productid=777把两个表符合条件的数据筛选出来（为何是两个表，由于有sod.productid=pd.ProductID,因此常量参数直接传递了），以后再进行inner on的匹配

以前没有重复数据的时候，因为product表productid列为主键，给定键值只有一条数据，那么对SalesOrderDetail来讲，输出的数据就是product表单条数据与SalesOrderDetail表的所有匹配数据

而把product进行重复插入后，mssql查觉到product表符合777的数据>1条了（见下图)

可是链接谓词列被指定常量777替换，但又没有其它的筛选条件，那么实际上查询等同于

SELECT sod.SalesOrderID,pd.Name FROM (select SalesOrderID from sales.SalesOrderDetail where productid=777) sod,
(select Name from production.product2 where productid=777) pd option(recompile)

同时，咱们也知道，nest loop算法的伪码以下：

咱们知道，nest loop的伪码算法是这样的，它的时间复杂度为N*M(或者说左表行数*右表行数)

for each row in tb1 loop
    for tb2  loop
    If match tb2.key= tb1.key then pass the row on to the next step
    If no match then discard the row
    end loop
end loop

上面的查询写法就变成了两个子结果集直接进行积卡尔笛，但并无任何可供比较的key值，因而产生了no join predicate警告

那么若是我换一个参数呢？好比productid=1的时候会是什么状况？

在本例中，因为SalesOrderDetail没有符合productid=1的数据，因此预估行数据就为1，这时无论product表有多少productid=1的数据，也表现为输出一对多的数据,因此也就没有显示出no join predicate警告。

其实能够说，若是查询计划里出现了no join predicate警告，就必需要看一下这个查询的业务逻辑是否是有问题，有多是输出大量无效的垃圾数据，而且影响了性能，可是这个说法反过来讲是不成立的，并非说没有没有警告就没产生重复的垃圾数据。

例如在以前我创建的复合索引是包含了productid和firstorder列

那我查询的写法可能会这么写

SELECT sod.SalesOrderID ,
        pd.Name
FROM    Sales.SalesOrderDetail sod
        INNER JOIN Production.product2 pd ON
        sod.salesorderdetailid= pd.firstorder and
        sod.ProductID=pd.ProductID
WHERE   pd.ProductID = 777 and pd.firstorder=28 option(recompile)

假设这两个表的数据量很大，且有至关多的数据，这时就有可能产生行数估值错误，出现无谓词警告，可是有可能业务逻辑并无问题（在本例中没有出现这种状况，只是举例说明）

表不变，但当查询这么写的时候

SELECT sod.SalesOrderID ,
        pd.Name
FROM    Sales.SalesOrderDetail sod
        INNER JOIN Production.product2 pd ON
        sod.ProductID=pd.ProductID
        and sod.salesorderdetailid= pd.firstorder
WHERE   pd.ProductID = 777-- and pd.firstorder=28
option(recompile)

由于两个数据子集除去productid被常量参数传递后不参与匹配后，还须要进一步对sod.salesorderdetailid= pd.firstorder进行匹配，这样不会出现无链接谓词警告，可是业务逻辑明显出现了问题，但我估计不会有人把上面查询修改写成下面这样吧……

固然在本篇文章中演示的案例数据量过小，并不能重现这种状况。有兴趣的同窗能够扩大数据量测试一下。

结论

在进行链接时无论左表仍是右表，只要有一个表能够产生一个惟一性数据（即nest loop的时间复杂度为1*M或者N*1)，这种状况下即便写成没有链接谓词的形式，也不会产生警告符，可是只要结果为N*M，且没有任何可供匹配的链接谓词（能够被常量传递的谓词不算），则会产生警告。

个人确是在生产环境中实实在在遇到了这种状况

，因为涉及公司的业务就不把所有计划截出来了，可是能够告诉你们的是，在nested loop下方的那个数据表，其实就存在有相似(productid,firstorder)这样的一个复合索引，且数据具备惟一性，可是由于统计信息的问题预估行数变成了1.25行，因而产生了无链接谓词警告

那么究竟这种警告到底须要不须要处理呢？个人见解是：看状况。

出现了警告，确定是DBA须要关注的，可是不是全部的警告必定就是有问题。

这须要与业务方沟通，究竟是业务逻辑出现了问题？仍是需求如此？又或者只是一个生成计划时的误判？

若是只是统计信息误判断生成查询计划显示的警告，但业务逻辑没有混乱，从我本身遇到的状况看，并无什么实质性的性能问题，能够忽略，若是您有什么不一样看法能够与我联系