二分查找又称折半查找,它是一种效率较高的查找方法。算法
二分查找要求:线性表是有序表,即表中结点按关键字有序,而且要用向量做为表的存储结构。不妨设有序表是递增有序的。性能
二、基本思想
spa
二分查找的基本思想是:指针
设R[low..high]是当前的查找区间code
(1)首先肯定该区间的中点位置:orm
(2)而后将待查的K值与R[mid].key比较:若相等,则查找成功并返回此位置,不然须肯定新的查找区间,继续二分查找,具体方法以下:排序
① 若R[mid].key>K,则由表的有序性可知R[mid..n].keys均大于K,所以若表中存在关键字等于K的结点,则该结点一定是在位置mid左边的子表R[1..mid-1]中,故新的查找区间是左子表R[1..mid-1]。ci
② 若R[mid].key<K,则要查找的K必在mid的右子表R[mid+1..n]中,即新的查找区间是右子表R[mid+1..n]。下一次查找是针对新的查找区间进行的。it
所以,从初始的查找区间R[1..n]开始,每通过一次与当前查找区间的中点位置上的结点关键字的比较,就可肯定查找是否成功,不成功则当前的查找区间就缩小一半。这一过程重复直至找到关键字为K的结点,或者直至当前的查找区间为空(即查找失败)时为止。io
二分查找只适用顺序存储结构。
/*折半查找*/ int Binary_Search(int a*,int n,int key) { int low,high,mid; low=1; /*定义最底下标为记录首位*/ high=n; /*定义最高下标为记录末位*/ while(low<=high) { mid=(low+high)/2; /*折半*/ if(key<a[mid]) high=mid-1; if(key>a[mid]) low=mid+1; else return mid; } return 0; }
也能够以下构造参数:
int BinSearch(SeqList R,KeyType K) { //在有序表R[1..n]中进行二分查找,成功时返回结点的位置,失败时返回零 int low=1; int high=n; int mid; //置当前查找区间上、下界的初值 while(low<=high) //当前查找区间R[low..high]非空 { mid=(low+high)/2; if(R[mid].key==K) return mid; //查找成功返回 if(R[mid].kdy>K) high=mid-1; //继续在R[low..mid-1]中查找 else low=mid+1; //继续在R[mid+1..high]中查找 } return 0; //当low>high时表示查找区间为空,查找失败 }
① 执行过程
设算法的输入实例中有序的关键字序列为
(05,13,19,21,37,56,64,75,80,88,92)
拓展:
二分查找断定树
二分查找过程可用二叉树来描述:把当前查找区间的中间位置上的结点做为根,左子表和右子表中的结点分别做为根的左子树和右子树。由此获得的二叉树,称为描述二分查找的断定树(Decision Tree)或比较树(Comparison Tree)。
注意:
断定树的形态只与表结点个数n相关,而与输入实例中R[1..n].keys的取值无关。
(1)二分查找断定树的组成
①圆结点即树中的内部结点。树中圆结点内的数字表示该结点在有序表中的位置。
②外部结点:圆结点中的全部空指针均用一个虚拟的方形结点来取代,即外部结点。
③树中某结点i与其左(右)孩子链接的左(右)分支上的标记"<"、"("、">"、")"表示:当待查关键字K<R[i].key(K>R[i].key)时,应走左(右)分支到达i的左(右)孩子,将该孩子的关键字进一步和K比较。若相等,则查找过程结束返回,不然继续将K与树中更下一层的结点比较。
(2)二分查找断定树的查找
二分查找就是将给定值K与二分查找断定树的根结点的关键字进行比较。若相等,成功。不然若小于根结点的关键字,到左子树中查找。若大于根结点的关键字,则到右子树中查找。
【例】对于有11个结点的表,若查找的结点是表中第6个结点,则只需进行一次比较;若查找的结点是表中第3或第9个结点,则需进行二次比较;找第1,4,7,10个结点须要比较三次;找到第2,5,8,11个结点须要比较四次。
因而可知,成功的二分查找过程刚好是走了一条从断定树的根到被查结点的路径,经历比较的关键字次数恰为该结点在树中的层数。若查找失败,则其比较过程是经历了一条从断定树根到某个外部结点的路径,所需的关键字比较次数是该路径上内部结点的总数。
【例】待查表的关键字序列为:(05,13,19,21,37,56,64,75,80,88,92),若要查找K=85的记录,所通过的内部结点为六、九、10,最后到达方形结点"9-10",其比较次数为3。
实际上方形结点中"i-i+1"的含意为被查找值K是介于R[i].key和R[i+1].key之间的,即R[i].key<K<R[i+1].key。
② 二分查找的平均查找长度
设内部结点的总数为n=2h-1,则断定树是深度为h=lg(n+1)的满二叉树(深度h不计外部结点)。树中第k层上的结点个数为2k-1,查找它们所需的比较次数是k。所以在等几率假设下,二分查找成功时的平均查找长度为:
ASLbn≈lg(n+1)-1
二分查找在查找失败时所需比较的关键字个数不超过断定树的深度,在最坏状况下查找成功的比较次数也不超过断定树的深度。即为:
二分查找的最坏性能和平均性能至关接近。
③ 二分查找的优势
折半查找的时间复杂度为O(logn),远远好于顺序查找的O(n)。
④ 二分查找的缺点
虽然二分查找的效率高,可是要将表按关键字排序。而排序自己是一种很费时的运算。既使采用高效率的排序方法也要花费O(nlgn)的时间。
⑤ 适用状况
二分查找只适用顺序存储结构。为保持表的有序性,在顺序结构里插入和删除都必须移动大量的结点。所以,二分查找特别适用于那种一经创建就不多改动、而又常常须要查找的线性表。
对那些查找少而又常常须要改动的线性表,可采用链表做存储结构,进行顺序查找。链表上没法实现二分查找。