经常使用查找算法及实现

1、顺序查找

    线性查找是在一个已知无(或有序)序队列中找出与给定关键字相同的数的具体位置。原理是ios

让关键字与队列中的数从最后一个开始逐个比较,直到找出与给定关键字相同的数为止,它的缺算法

点是效率低下。数组

   一、算法原理

   1)从表中的最后一个记录开始,逐个进行记录的关键字与给定值进行比较,若某个记录的关函数

键字与给定值相等,则查找成功,找到所查的记录;性能

  2)反之,若直到第一个记录,其关键字和给定值比较都不相等,则代表表中没有所查的记spa

录,查找失败。   设计

  二、算法分析

    顺序查找的平均查找长度(Average Search Length,ASL)为(n+1)/2,当查找不成功时,需code

要n+1次比较,时间复杂度为O(n);排序

 三、算法实现索引

/*
  顺序查找。
*/

#include <iostream>
#include <stdio.h>

int SequenceSearch( int *array, int n, int key )
{
  if( array == NULL || n < 0 )
  {
    printf( "invalid input.\n" );
    return -1;
  }
  int i ;
  array[ 0 ] = key;
  
  for( i = n; array[ i ] != array[ 0 ]; i-- )
  {
    if( array[ i ] == key )
      break;
  }
  if( i == 0 )
    return 0;
  else
    return i;
}

void Test( const char* testName, int* array, int n, int key )
{
  if( testName == NULL ) 
  {
    printf( "test invaild input.\n" );
    return;
  }

  printf( "%s begins: \n", testName );

  if( array == NULL )
  {
    printf( "test invaild input.\n" );
    return;
  }

  int found = SequenceSearch( array, n, key );

  if( found != 0 )
    printf( "found the key: %d in index %d\n", key, found );
  else
    printf( "not found the key: %d\n", key );

  printf( "\n" );
}

// 要找的数字存在
void Test1()
{
  int array[ ] = { 0, 42, 24, 61, 71, 11, 57 };
  Test( "Test1", array, 6, 71 ); 
}

// 要找的数字不存在
void Test2()
{
  int array[ ] = { 0, 421, 24, 6,421, 121, 54 };
  Test( "Test2", array, 6, 88 ); 
}


// 输入数组为空
void Test3()
{
  int emptyArray[ ] = { };
  Test( "Test3", emptyArray, 0, 0 ); 
}

// 输入数组为null,且长度异常
void Test4()
{
  Test( "Test4", NULL, -1, -999 ); 
}

int main()
{
  Test1();
  Test2();
  Test3();
  Test4();

  return 0;
}

2、二分查找

    二分查找又称折半查找,优势是比较次数少,查找次数快,平均性能好;其缺点是要求待查表

为有序表,且插入删除困难。所以,折半查找方法使用于不常常变更而查找频繁的有序列表。

首先,假设表中元素是升序排列的,将表中间位置记录的关键字与查找关键字比较,若是二者

相等,则查找成功;不然利用中间位置记录将表分红前、后两个子表,若是中间位置记录的关键

字大于查找关键字,则进一步查找前一子表,不然进一步查找后一子表。重复以上过程,直到

找到知足条件的记录,使查找成功,或直到子表不存在为止,此时查找不成功。

   一、算法原理

   要求:1)必须采用顺序储存结构。2)必须按关键字大小有序排列。

   基本思想:

   1)将n个元素分红大体相等的两部分,取a[n/2]与x作比较,若是x=a[n/2],则找到x,算法停止;

   2)若是x<a[n/2],则只要在数组a的左半部分继续搜索x,若是x>a[n/2],则只要在数组a的右半部搜

索x.

  二、算法分析 

    总共有n个元素,渐渐跟下去就是n,n/2,n/4,....n/2^k(接下来操做元素的剩余个数),其中k就

是循环的次数因为你n/2^k取整后>=1即令n/2^k=1可得k=log2n,(是以2为底,n的对数)因此时

间复杂度能够表示O()=O(logn)。

  三、算法实现   

/*
  二分查找。
*/

#include <iostream>
#include <stdio.h>

int BinarySearch( int *array, int start, int end, int key )
{
  int left, mid, right;
  
  bool found = false; // 判断是否找到

  left = start;
  right = end;
  
  while( left <= right )
  {
    mid = ( left + right ) / 2;

    if( key == array[ mid ] )
    {
      found = true;
      break;
    }
    else if( key < array[ mid ] )
      right = mid - 1;
    else if( key > array[ mid ] )
      left = mid + 1;
  }
  
  if( found )
    return mid;
  else
    return -1;
}

void Test( const char* testName, int* array, int start, int end, int key )
{
  if( testName == NULL ) 
  {
    printf( "test invaild input.\n" );
    return;
  }

  printf( "%s begins: \n", testName );

  if( array == NULL )
  {
    printf( "test invaild input.\n" );
    return;
  }

  int found = BinarySearch( array, start, end, key );

  if( found >= 0  )
    printf( "found the key: %d in index %d\n", key, found );
  else
    printf( "not found the key: %d\n", key );

  printf( "\n" );
}

// 要找的数字存在
void Test1()
{
  int array[ ] = { 11, 24, 42, 56, 71, 96 };
  Test( "Test1", array, 0, 5, 71 ); 
}

// 要找的数字不存在
void Test2()
{
  int array[ ] = { 21, 24, 46, 56, 72, 82 };
  Test( "Test2", array, 0, 5, 88 ); 
}


// 输入数组为空
void Test3()
{
  int emptyArray[ ] = { };
  Test( "Test3", emptyArray, 0, 0, 0 ); 
}

// 输入数组为null,且长度异常
void Test4()
{
  Test( "Test4", NULL, -1, -1, -999 ); 
}

int main()
{
  Test1();
  Test2();
  Test3();
  Test4();

  return 0;
}

3、分块查找

     分块查找是折半查找和顺序查找的一种改进方法,分块查找因为只要求索引表是

序的,对快内结点没有排序要求,所以特别适合结点动态变化的状况。当增长或减

少节以及节点的关键码改变时,只需将该节点调整到所在的块便可。在空间复杂性上,分块查

的主要代价是增长了一个辅助数组。须要注意的是,当节点变化很频繁时,可能会致使块与

之间的节点数相差很大,没写快具备不少节点,而另外一些块则可能只有不多节点,这将会导

查找效率的降低。

      分块查找要求把一个大的线性表分解成若干块,每块中的节点能够任意存放,但块与块之间

必须排序。假设是按关键码值非递减的,那么这种块与块之间必须知足已 排序要求,实际上就

是对于任意的i,第i块中的全部节点的关键码值都必须小于第i+1块中的全部节点的关键码值。

此外,还要创建一个索引表,把每块中的最 大关键码值做为索引表的关键码值,按块的顺序存

放到一个辅助数组中,显然这个辅助数组是按关键码值费递减排序的。查找时,首先在索引表

中进行查找,肯定要 找的节点所在的块。因为索引表是排序的,所以,对索引表的查找能够采

用顺序查找或折半查找;而后,在相应的块中采用顺序查找,便可找到对应的节点。

   一、算法原理

   1)先选取各块中的最大关键字构成一个索引表;

   2)查找分两个部分:先对索引表进行二分查找或顺序查找,以肯定待查记录在哪一块中,然

后在以肯定的快中用顺序法进行查找。

  二、算法分析 

    分块查找的平均查找长度由两部分组成,一个是对索引表进行查找的平均查找长度,一个是

对快内节点进行查找的平均查找长度,总的平均查找长度为 E(n)=+。线性表中共有n个节点,

分红大小相等的b块,每块有s=n/b个节点。假定读索引表也采用顺序查找,只考虑查找成功的

状况,并假定对每一个节 点的查找几率是相等的,则对每块的查找几率是1/b,对快内每一个节点的

查找几率是1/s。  查找速度介于顺序查找O(n)和折半查找O(logn)之间。

  三、算法实现

/*
  分块查找。
*/

#include <iostream>
#include <stdio.h>

struct indexBlock  // 定义块的结构
{
  int key;
  int start;
  int end;
};  // 定义结构体数组

int BlockSearch( int *array, int length, int gap, int key )
{
  if( array == NULL || length <= 0 || gap <= 0 )
  {
    printf( "invalid input.\n" );
    return -1;
  }

  int i = 0;
  int j;
  int begin = -1;
  int k;

  int nBlock = length / gap; 
  
  if( nBlock * gap < length )
    nBlock++;  

  indexBlock block[ nBlock ];  // 数组分为nBlock块

  for( k = 0; k < nBlock; k++ )
  {
    block[ k ].start = begin + 1;  // 肯定每一个块范围的起始值
    begin++;
  
    block[ k ].end = begin + length / nBlock - 1;  // 肯定每一个块范围的结束值
    begin += ( length / nBlock - 1 );
    
    if( k < nBlock - 1 )
      block[ k ].key = array[ begin ];  // 肯定每一个块范围中元素的最大值
    else
      block[ k ].key = array[ length - 1 ]; // 肯定最后一块中元素的最大值
  }

  while( i < nBlock && key > block[ i ].key )  // 肯定在哪一个块中
  {
    i++;
  }

  if( i >= nBlock )   // 大于分的块数,则返回-1,找不到该数
    return -1;
 
  j = block[ i ].start;  // j等于块范围的起始值
  
  while( j <= block[ i ].end && array[ j ] != key )  // 在肯定的块内进行查找
  {
    j++;
  }

  if( j > block[ i ].end )  // 若是大于块范围的结束值,则说明没有要查找的数,j置为-1
  {
    j = -1; 
  }

  return j;
}

void Test( const char* testName, int* array, int length, int gap, int key )
{
  if( testName == NULL ) 
  {
    printf( "test invaild input.\n" );
    return;
  }

  printf( "%s begins: \n", testName );

  int found = BlockSearch( array, length, gap, key );

  if( found >= 0 )
    printf( "found the key: %d in index %d\n", key, found );
  else
    printf( "not found the key: %d\n", key );

  printf( "\n" );
}

// 要找的数字存在,12个元素分为3组,每组恰好4个元素
void Test1()
{
  int array[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20, 40, 50 };
  Test( "Test1", array, 12, 4, 8 ); 
}

// 要找的数字不存在,12个元素分为3组,每组恰好4个元素
void Test2()
{
  int array[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20, 40, 50 };
  Test( "Test2", array, 12, 4, 99 ); 
}

// 要找的数字存在,10个元素分为3组,前两组4个元素,最后一组2个元素
void Test3()
{
  int emptyArray[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20 };
  Test( "Test3", emptyArray, 10, 4, 11 ); 
}

// 要找的数字不存在,10个元素分为3组,前两组4个元素,最后一组2个元素
void Test4()
{
  int emptyArray[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20 };
  Test( "Test4", emptyArray, 10, 4, 88 ); 
}

// 输入数组为空
void Test5()
{
  int emptyArray[ ] = { };
  Test( "Test5", emptyArray, 0, 0, -1 ); 
}

// 输入数组为null,且长度异常
void Test6()
{
  Test( "Test6", NULL, -1, 0, -1 ); 
}

int main()
{
  Test1();
  Test2();
  Test3();
  Test4();
  Test5();
  Test6();

  return 0;
}

4、哈希查找

    哈希查找是经过计算数据元素的存储地址进行查找的一种方法。咱们使用一个下标范围比较

大的数组来存储元素。能够设计一个函数(哈希函数, 也叫作散列函数),使得每一个元素的关

键字都与一个函数值(即数组下标)相对应,因而用这个数组单元来存储这个元素;也能够简

单的理解为,按照关键字为每个元素"分类",而后将这个元素存储在相应"类"所对应的地方。

可是,不可以保证每一个元素的关键字与函数值是一一对应的,所以极有可能出现对于不一样的元

素,却计算出了相同的函数值,这样就产生了"冲突",换句话说,就是把不一样的元素分在了相同

的"类"之中。

   一、算法原理

   哈希查找步骤:

  1)用给定的哈希函数构造哈希表;

  2)根据选择的冲突处理方法解决地址冲突;

  3)在哈希表的基础上执行哈希查找。

  创建哈希表操做步骤:

  1)取数据元素的关键字key,计算其哈希函数值。若该地址对应的存储空间尚未被占用,则

将该元素存入;不然执行step2解决冲突。

  2)根据选择的冲突处理方法,计算关键字key的下一个存储地址。若下一个存储地址仍被占

用,则继续执行step2,直到找到能用的存储地址为止。

  哈希查找步骤为:

  1)Step1 对给定k值,计算哈希地址 Di=Hk);若HST为空,则查找失败;若HST=k,则查

找成功;不然,执行step2(处理冲突)。

  2)Step2 重复计算处理冲突的下一个存储地址 Dk=RDk-1),直到HST[Dk]为空,或

HST[Dk]=k为止。若HST[Dk]=K,则查找成功,不然查找失败。

  二、算法分析 

  时间复杂度几乎是O(1),取决于产生冲突的多少。

  三、算法实现

/*
  哈希查找。实现哈希函数为“除法取余法”,解决冲突为“开放地址线性探测法”。
--除法取余法:key=value%C;
--开放地址线性探测法:若是两个数据元素的哈希值相同,则在哈希表中为后插入的数据元素另外选择一个表项。当程序查找哈希表时,
  若是没有在第一个对应的哈希表项中找到符合查找要求的数据元素,程序就会继续日后查找,直到找到一个符合查找要求的数据元素,
  或者遇到一个空的表项。 
*/

#include <iostream>
#include <stdio.h>

void InsertHash( int *hashArray, int length, int data )
{
  int hashAddress = data % length; // 哈希函数
  
  while( hashArray[ hashAddress ] != 0 )  // 若是key存在,则说明已经被别人占用,此时必须解决冲突,这里假设哈希表元素都初始化为0,而插入元素都大于0
  {
    hashAddress = ( ++hashAddress ) % length;  // 用开放寻址法找到
  }

  hashArray[ hashAddress ] = data;
}

int HashSearch( int *hashArray, int length, int key )
{
  if( hashArray == NULL || length <= 0 )
  {
    printf( "invalid input.\n" );
    return -1;
  }
  
  int hashAddress = key % length;

  while( hashArray[ hashAddress ] != 0 && hashArray[ hashAddress ] != key )
  {
    hashAddress = ( ++hashAddress ) % length;
  }

  if( hashArray[ hashAddress ] == 0 )
    return -1;
  else
    return hashAddress;
}

void Test( const char* testName, int* hashArray, int length, int key )
{
  if( testName == NULL ) 
  {
    printf( "test invaild input.\n" );
    return;
  }

  printf( "%s begins: \n", testName );

  int found = HashSearch( hashArray, length, key );

  if( found >= 0 )
    printf( "found the key: %d in index %d\n", key, found );
  else
    printf( "not found the key: %d\n", key );

  printf( "\n" );
}

// 要找的数字存在,数组12个元素,哈希表的大小选为离数组大小二倍最近的质数,这里是29
void Test1()
{
  int length = 29;
  int arrayLength = 12;
  int array[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20, 40, 50 };

  int *hash = new int[ length ];
  
  for( int i = 0; i < length; i++ )
  {
    hash[ i ] = 0;    // 初始化哈希表元素为0
  }
  
  for( int j = 0; j < arrayLength; j++ )
  {
    InsertHash( hash, length, array[ j ] );
  }

  Test( "Test1", hash, length, 15 ); 

  delete [] hash;
}

// 要找的数字不存在,数组12个元素,哈希表的大小选为离数组大小二倍最近的质数,这里是29
void Test2()
{
  int length = 29;
  int arrayLength = 12;
  int array[ ] = { 5, 3, 6, 7, 9, 8, 11, 15, 18, 20, 40, 50 };

  int *hash = new int[ length ];
  
  for( int i = 0; i < length; i++ )
  {
    hash[ i ] = 0;    // 初始化哈希表元素为0
  }
  
  for( int i = 0; i < arrayLength; i++ )
  {
    InsertHash( hash, length, array[ i ] );
  }

  Test( "Test2", hash, length, 2 ); 

  delete [] hash;
}

// 输入数组为null,且长度异常
void Test3()
{
  Test( "Test3", NULL, -1, -1 ); 
}

int main()
{
  Test1();
  Test2();
  Test3();
  
  return 0;
}

相关文章
相关标签/搜索