经常使用查找算法及实现

时间 2019-11-09

标签经常使用查找算法实现栏目应用数学繁體版

原文原文链接

1、顺序查找

线性查找是在一个已知无（或有序）序队列中找出与给定关键字相同的数的具体位置。原理是ios

让关键字与队列中的数从最后一个开始逐个比较，直到找出与给定关键字相同的数为止，它的缺算法

点是效率低下。数组

一、算法原理

1）从表中的最后一个记录开始，逐个进行记录的关键字与给定值进行比较，若某个记录的关函数

键字与给定值相等，则查找成功，找到所查的记录；性能

2）反之，若直到第一个记录，其关键字和给定值比较都不相等，则代表表中没有所查的记spa

录，查找失败。设计

二、算法分析

顺序查找的平均查找长度（Average Search Length，ASL）为(n+1)/2，当查找不成功时，需code

要n+1次比较，时间复杂度为O(n);排序

三、算法实现索引

/*
  顺序查找。
*/

#include <iostream>
#include <stdio.h>

int SequenceSearch( int *array, int n, int key )
{
  if( array == NULL || n < 0 )
  {
    printf( "invalid input.\n" );
    return -1;
  }
  int i ;
  array[ 0 ] = key;
  
  for( i = n; array[ i ] != array[ 0 ]; i-- )
  {
    if( array[ i ] == key )
      break;
  }
  if( i == 0 )
    return 0;
  else
    return i;
}

void Test( const char* testName, int* array, int n, int key )
{
  if( testName == NULL ) 
  {
    printf( "test invaild input.\n" );
    return;
  }

  printf( "%s begins: \n", testName );

  if( array == NULL )
  {
    printf( "test invaild input.\n" );
    return;
  }

  int found = SequenceSearch( array, n, key );

  if( found != 0 )
    printf( "found the key: %d in index %d\n", key, found );
  else
    printf( "not found the key: %d\n", key );

  printf( "\n" );
}

// 要找的数字存在
void Test1()
{
  int array[ ] = { 0, 42, 24, 61, 71, 11, 57 };
  Test( "Test1", array, 6, 71 ); 
}

// 要找的数字不存在
void Test2()
{
  int array[ ] = { 0, 421, 24, 6,421, 121, 54 };
  Test( "Test2", array, 6, 88 ); 
}


// 输入数组为空
void Test3()
{
  int emptyArray[ ] = { };
  Test( "Test3", emptyArray, 0, 0 ); 
}

// 输入数组为null，且长度异常
void Test4()
{
  Test( "Test4", NULL, -1, -999 ); 
}

int main()
{
  Test1();
  Test2();
  Test3();
  Test4();

  return 0;
}

2、二分查找

二分查找又称折半查找，优势是比较次数少，查找次数快，平均性能好;其缺点是要求待查表

为有序表，且插入删除困难。所以，折半查找方法使用于不常常变更而查找频繁的有序列表。

首先，假设表中元素是升序排列的，将表中间位置记录的关键字与查找关键字比较，若是二者

相等，则查找成功;不然利用中间位置记录将表分红前、后两个子表，若是中间位置记录的关键

字大于查找关键字，则进一步查找前一子表，不然进一步查找后一子表。重复以上过程，直到

找到知足条件的记录，使查找成功，或直到子表不存在为止，此时查找不成功。

一、算法原理

要求：1）必须采用顺序储存结构。2）必须按关键字大小有序排列。

基本思想：

1）将n个元素分红大体相等的两部分，取a[n/2]与x作比较，若是x=a[n/2],则找到x,算法停止；

2）若是x<a[n/2],则只要在数组a的左半部分继续搜索x,若是x>a[n/2],则只要在数组a的右半部搜

索x.

二、算法分析

总共有n个元素，渐渐跟下去就是n,n/2,n/4,....n/2^k（接下来操做元素的剩余个数），其中k就

是循环的次数因为你n/2^k取整后>=1即令n/2^k=1可得k=log2n,（是以2为底，n的对数）因此时

间复杂度能够表示O()=O(logn)。

三、算法实现

/*
  二分查找。
*/

#include <iostream>
#include <stdio.h>

int BinarySearch( int *array, int start, int end, int key )
{
  int left, mid, right;
  
  bool found = false; // 判断是否找到

  left = start;
  right = end;
  
  while( left <= right )
  {
    mid = ( left + right ) / 2;

    if( key == array[ mid ] )
    {
      found = true;
      break;
    }
    else if( key < array[ mid ] )
      right = mid - 1;
    else if( key > array[ mid ] )
      left = mid + 1;
  }
  
  if( found )
    return mid;
  else
    return -1;
}

void Test( const char* testName, int* array, int start, int end, int key )
{
  if( testName == NULL ) 
  {
    printf( "test invaild input.\n" );
    return;
  }

  printf( "%s begins: \n", testName );

  if( array == NULL )
  {
    printf( "test invaild input.\n" );
    return;
  }

  int found = BinarySearch( array, start, end, key );

  if( found >= 0  )
    printf( "found the key: %d in index %d\n", key, found );
  else
    printf( "not found the key: %d\n", key );

  printf( "\n" );
}

// 要找的数字存在
void Test1()
{
  int array[ ] = { 11, 24, 42, 56, 71, 96 };
  Test( "Test1", array, 0, 5, 71 ); 
}

// 要找的数字不存在
void Test2()
{
  int array[ ] = { 21, 24, 46, 56, 72, 82 };
  Test( "Test2", array, 0, 5, 88 ); 
}


// 输入数组为空
void Test3()
{
  int emptyArray[ ] = { };
  Test( "Test3", emptyArray, 0, 0, 0 ); 
}

// 输入数组为null，且长度异常
void Test4()
{
  Test( "Test4", NULL, -1, -1, -999 ); 
}

int main()
{
  Test1();
  Test2();
  Test3();
  Test4();

  return 0;
}

3、分块查找

分块查找是折半查找和顺序查找的一种改进方法，分块查找因为只要求索引表是

有序的，对快内结点没有排序要求，所以特别适合结点动态变化的状况。当增长或减

少节以及节点的关键码改变时，只需将该节点调整到所在的块便可。在空间复杂性上，分块查

找的主要代价是增长了一个辅助数组。须要注意的是，当节点变化很频繁时，可能会致使块与

块之间的节点数相差很大，没写快具备不少节点，而另外一些块则可能只有不多节点，这将会导

致查找效率的降低。

分块查找要求把一个大的线性表分解成若干块，每块中的节点能够任意存放，但块与块之间

必须排序。假设是按关键码值非递减的，那么这种块与块之间必须知足已排序要求，实际上就

是对于任意的i，第i块中的全部节点的关键码值都必须小于第i+1块中的全部节点的关键码值。

此外，还要创建一个索引表，把每块中的最大关键码值做为索引表的关键码值，按块的顺序存

放到一个辅助数组中，显然这个辅助数组是按关键码值费递减排序的。查找时，首先在索引表

中进行查找，肯定要找的节点所在的块。因为索引表是排序的，所以，对索引表的查找能够采

用顺序查找或折半查找；而后，在相应的块中采用顺序查找，便可找到对应的节点。

一、算法原理

1）先选取各块中的最大关键字构成一个索引表;

2）查找分两个部分：先对索引表进行二分查找或顺序查找，以肯定待查记录在哪一块中，然

后在以肯定的快中用顺序法进行查找。

二、算法分析

分块查找的平均查找长度由两部分组成，一个是对索引表进行查找的平均查找长度，一个是

对快内节点进行查找的平均查找长度，总的平均查找长度为 E(n)=+。线性表中共有n个节点，

分红大小相等的b块，每块有s=n/b个节点。假定读索引表也采用顺序查找，只考虑查找成功的

状况，并假定对每一个节点的查找几率是相等的，则对每块的查找几率是1/b，对快内每一个节点的

查找几率是1/s。查找速度介于顺序查找O(n)和折半查找O(logn)之间。

三、算法实现

/*
  分块查找。
*/

#include <iostream>
#include <stdio.h>

struct indexBlock  // 定义块的结构
{
  int key;
  int start;
  int end;
};  // 定义结构体数组

int BlockSearch( int *array, int length, int gap, int key )
{
  if( array == NULL || length <= 0 || gap <= 0 )
  {
    printf( "invalid input.\n" );
    return -1;
  }

  int i = 0;
  int j;
  int begin = -1;
  int k;

  int nBlock = length / gap; 
  
  if( nBlock * gap < length )
    nBlock++;  

  indexBlock block[ nBlock ];  // 数组分为nBlock块

  for( k = 0; k < nBlock; k++ )
  {
    block[ k ].start = begin + 1;  // 肯定每一个块范围的起始值
    begin++;
  
    block[ k ].end = begin + length / nBlock - 1;  // 肯定每一个块范围的结束值
    begin += ( length / nBlock - 1 );
    
    if( k < nBlock - 1 )
      block[ k ].key = array[ begin ];  // 肯定每一个块范围中元素的最大值
    else
      block[ k ].key = array[ length - 1 ]; // 肯定最后一块中元素的最大值
  }

  while( i < nBlock && key > block[ i ].key )  // 肯定在哪一个块中
  {
    i++;
  }

  if( i >= nBlock )   // 大于分的块数，则返回-1,找不到该数
    return -1;
 
  j = block[ i ].start;  // j等于块范围的起始值
  
  while( j <= block[ i ].end && array[ j ] != key )  // 在肯定的块内进行查找
  {
    j++;
  }

  if( j > block[ i ].end )  // 若是大于块范围的结束值，则说明没有要查找的数，j置为-1
  {
    j = -1; 
  }

  return j;
}

void Test( const char* testName, int* array, int length, int gap, int key )
{
  if( testName == NULL ) 
  {
    printf( "test invaild input.\n" );
    return;
  }

  printf( "%s begins: \n", testName );

  int found = BlockSearch( array, length, gap, key );

  if( found >= 0 )
    printf( "found the key: %d in index %d\n", key, found );
  else
    printf( "not found the key: %d\n", key );

  printf( "\n" );
}

// 要找的数字存在,12个元素分为3组，每组恰好4个元素
void Test1()
{
  int array[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20, 40, 50 };
  Test( "Test1", array, 12, 4, 8 ); 
}

// 要找的数字不存在，12个元素分为3组，每组恰好4个元素
void Test2()
{
  int array[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20, 40, 50 };
  Test( "Test2", array, 12, 4, 99 ); 
}

// 要找的数字存在，10个元素分为3组，前两组4个元素，最后一组2个元素
void Test3()
{
  int emptyArray[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20 };
  Test( "Test3", emptyArray, 10, 4, 11 ); 
}

// 要找的数字不存在，10个元素分为3组，前两组4个元素，最后一组2个元素
void Test4()
{
  int emptyArray[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20 };
  Test( "Test4", emptyArray, 10, 4, 88 ); 
}

// 输入数组为空
void Test5()
{
  int emptyArray[ ] = { };
  Test( "Test5", emptyArray, 0, 0, -1 ); 
}

// 输入数组为null，且长度异常
void Test6()
{
  Test( "Test6", NULL, -1, 0, -1 ); 
}

int main()
{
  Test1();
  Test2();
  Test3();
  Test4();
  Test5();
  Test6();

  return 0;
}

4、哈希查找

哈希查找是经过计算数据元素的存储地址进行查找的一种方法。咱们使用一个下标范围比较

大的数组来存储元素。能够设计一个函数（哈希函数，也叫作散列函数），使得每一个元素的关

键字都与一个函数值（即数组下标）相对应，因而用这个数组单元来存储这个元素；也能够简

单的理解为，按照关键字为每个元素"分类"，而后将这个元素存储在相应"类"所对应的地方。

可是，不可以保证每一个元素的关键字与函数值是一一对应的，所以极有可能出现对于不一样的元

素，却计算出了相同的函数值，这样就产生了"冲突"，换句话说，就是把不一样的元素分在了相同

的"类"之中。

一、算法原理

哈希查找步骤：

1）用给定的哈希函数构造哈希表；

2）根据选择的冲突处理方法解决地址冲突；

3）在哈希表的基础上执行哈希查找。

创建哈希表操做步骤：

1）取数据元素的关键字key，计算其哈希函数值。若该地址对应的存储空间尚未被占用，则

将该元素存入；不然执行step2解决冲突。

2）根据选择的冲突处理方法，计算关键字key的下一个存储地址。若下一个存储地址仍被占

用，则继续执行step2，直到找到能用的存储地址为止。

哈希查找步骤为：

1）Step1 对给定k值，计算哈希地址 Di=H（k）；若HST为空，则查找失败；若HST=k，则查

找成功；不然，执行step2（处理冲突）。

2）Step2 重复计算处理冲突的下一个存储地址 Dk=R（Dk-1），直到HST[Dk]为空，或

HST[Dk]=k为止。若HST[Dk]=K，则查找成功，不然查找失败。

二、算法分析

时间复杂度几乎是O(1)，取决于产生冲突的多少。

三、算法实现

/*
  哈希查找。实现哈希函数为“除法取余法”，解决冲突为“开放地址线性探测法”。
--除法取余法：key=value%C;
--开放地址线性探测法：若是两个数据元素的哈希值相同，则在哈希表中为后插入的数据元素另外选择一个表项。当程序查找哈希表时，
  若是没有在第一个对应的哈希表项中找到符合查找要求的数据元素，程序就会继续日后查找，直到找到一个符合查找要求的数据元素，
  或者遇到一个空的表项。　
*/

#include <iostream>
#include <stdio.h>

void InsertHash( int *hashArray, int length, int data )
{
  int hashAddress = data % length; // 哈希函数
  
  while( hashArray[ hashAddress ] != 0 )  // 若是key存在，则说明已经被别人占用，此时必须解决冲突,这里假设哈希表元素都初始化为0,而插入元素都大于0
  {
    hashAddress = ( ++hashAddress ) % length;  // 用开放寻址法找到
  }

  hashArray[ hashAddress ] = data;
}

int HashSearch( int *hashArray, int length, int key )
{
  if( hashArray == NULL || length <= 0 )
  {
    printf( "invalid input.\n" );
    return -1;
  }
  
  int hashAddress = key % length;

  while( hashArray[ hashAddress ] != 0 && hashArray[ hashAddress ] != key )
  {
    hashAddress = ( ++hashAddress ) % length;
  }

  if( hashArray[ hashAddress ] == 0 )
    return -1;
  else
    return hashAddress;
}

void Test( const char* testName, int* hashArray, int length, int key )
{
  if( testName == NULL ) 
  {
    printf( "test invaild input.\n" );
    return;
  }

  printf( "%s begins: \n", testName );

  int found = HashSearch( hashArray, length, key );

  if( found >= 0 )
    printf( "found the key: %d in index %d\n", key, found );
  else
    printf( "not found the key: %d\n", key );

  printf( "\n" );
}

// 要找的数字存在,数组12个元素，哈希表的大小选为离数组大小二倍最近的质数，这里是29
void Test1()
{
  int length = 29;
  int arrayLength = 12;
  int array[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20, 40, 50 };

  int *hash = new int[ length ];
  
  for( int i = 0; i < length; i++ )
  {
    hash[ i ] = 0;    // 初始化哈希表元素为0
  }
  
  for( int j = 0; j < arrayLength; j++ )
  {
    InsertHash( hash, length, array[ j ] );
  }

  Test( "Test1", hash, length, 15 ); 

  delete [] hash;
}

// 要找的数字不存在,数组12个元素，哈希表的大小选为离数组大小二倍最近的质数，这里是29
void Test2()
{
  int length = 29;
  int arrayLength = 12;
  int array[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20, 40, 50 };

  int *hash = new int[ length ];
  
  for( int i = 0; i < length; i++ )
  {
    hash[ i ] = 0;    // 初始化哈希表元素为0
  }
  
  for( int i = 0; i < arrayLength; i++ )
  {
    InsertHash( hash, length, array[ i ] );
  }

  Test( "Test2", hash, length, 2 ); 

  delete [] hash;
}

// 输入数组为null，且长度异常
void Test3()
{
  Test( "Test3", NULL, -1, -1 ); 
}

int main()
{
  Test1();
  Test2();
  Test3();
  
  return 0;
}