T1是一棵含有几百万个节点的树,T2含有几百个节点。判断T2是不是T1 的子树。算法
首先考虑小数据量的状况,能够根据树的前序和中序遍历所得的字符串,来经过判断T2生成的字符串是不是T1字符串的子串,来判断T2是不是T1的子树。假设T1的节点数为N,T2的节点数为M。遍历两棵树算法时间复杂性是O(N + M), 判断字符串是否为另外一个字符串的子串的复杂性也是O( N + M)(好比使用KMP算法)。所须要的空间也是O(N + M)。scala
这里有一个问题须要注意:对于左节点或者右节点为null的状况,须要在字符串中插入特殊字符表示。不然对于下面这种情形将会判断错误:code
所以若是插入特殊字符,上述两棵树的中序和前序遍历的结果是相同的。blog
因为本例有几百万的节点,须要占用O(N + M)的内存。递归
若是换一种思路,就是遍历T1,每当T1的某个节点与T2的根节点值相同时,就判断两棵子树是否相同。这个算法的复杂度是O(N*M)。咱们再仔细思考一下。由于只有在节点值与T2的根节点值相同才会调用O(M)。假设有K次这种状况,那么算法的复杂度就是O(N + K*M)。下面是代码实现:ip
struct TreeNode{ TreeNode *leftChild; TreeNode *rightChild; int data; }; // check sub tree n1 == sub tree n2 bool checkSubTree(const TreeNode* n1, const TreeNode* n2){ if( n1 == nullptr && n2 == nullptr ) return true; if( n1 == nullptr || n2 == nullptr ) return false; if( n1->data != n2->data ) return false; return checkSubTree(n1->leftChild, n2->leftChild) && checkSubTree(n1->rightChild, n2->rightChild); } bool subTree(const TreeNode *n1, const TreeNode *n2){ if( n1 == nullptr){ return false; // the bigger tree is empty, so t2 is not subtree of t1 } if( n1->data == n2->data){ if( checkSubTree(n1, n2)) return true; } return subTree(n1->leftChild, n2) || subTree(n2->rightChild, n2); }
1)方法一会占用O(N + M)的内存,而另一种解法只会占用O(logN + logM)的内存(递归的栈内存)。当考虑scalability扩展性时,内存使用的多寡是个很重要的因素。内存
2)方法一的时间复杂度为O(N + M),方法二最差的时间复杂度是O(N*M)。因此要经过工程实践或者是历史数据看一下哪一种方法更优。固然了,方法二也可能会很早发现两棵树的不一样,早早的退出了checkSubTree。字符串
总的来讲,在空间使用上,方法二更好。在时间上,须要经过实际数据来验证。
it