哈希，hash

时间 2021-01-29

标签 ios 函数 spa 翻译 code 字符串 get string hash 栏目 iOS 繁體版

原文原文链接

Hash，通常翻译作散列、杂凑，或音译为哈希。————摘自百度百科
先来看个题：给你一坨一些键值集<key,value>,\(key\)的范围是\([1,10^{10}]\)，每次询问\(x\)，回答\(key=x\)的\(value\)这种一看就知道暴力不行……因而，有些同窗会说：我会用map！但map的查询是 \(O(logn)\)的 QwQ。那么哈希能够怎么作呢？咱们可让\(hash[f(key)]=value\)，其中\(f()\)函数被称为哈希函数。至于\(f()\)函数怎么写……想怎么写就怎么写！没错，你想怎么写就怎么写。通常有这么几种方法：ios

直接定值法：让\(F(key)=key\)。读者：那不和通常的同样嘛！要你何用？咳咳，总要从最基础的开始嘛……好了，这个方法就此结束。
折叠法：将关键字分红几部分，取这几部分的和的前几位为哈希地址。例如ISBN码(~~对就是那道入门题~~)，以0-442-20586-4为例，能够获得其哈希地址是：\(hash = 0442 + 2058 + 64 = 2564\)诶？以前不是说前几位吗？由于这里没有进位啊……若是获得结果是\(10934\)，那么其哈希地址就是\(0934\)。
取余数法：这是\(OI\)中最最经常使用的，就是对其求余为哈希地址，如\(4325\)，模\(233333\)后得\(4325\)，那么她的哈希地址就是\(4325\)。

那么如今上面那个问题就好解决了，只要用取余数法求得\(key\)的哈希地址就能够大大压缩空间了！
可是，你不要高兴太早！相信有许多人已经看出来了，哈希的缺点很明显，就是容易出现不一样的元素有同一个哈希地址的状况，咱们通常称其为：哈希冲突。那么有什么方法能解决哈希冲突呢？有许多方法：函数

线性探测再散列：若是多个数有同一个哈希地址，如：0 0 0 34 6 44 0 0注：0表示没有元素。而后又有一个元素\(8\)，获得其哈希地址也是4（即34所在的位置），那么咱们就日后挪一挪：大哥你先来的，我到后面去。因而来到了6的位置——也被占了，那么再日后移……最后到了7（即44后面那个）。而后查询时只要依次日后找就能够了。
多重哈希：我的比较喜欢叫双模数，就是进行屡次哈希，固然，每次的模数都不同。若是两次哈希的地址都对应，我才认为是同一个。通常状况下双模数就足够了，因此我喜欢叫双模数。要是有三模数，那基本不会冲突了。
链地址法：还记得链式前向星吗？（~~不记得！那还不滚回去学~~）链式前向星就是把其后面一个一个地链起来，这个也同样，若是哈希地址相同，就链起来。因而乎，咱们又想：那开个\(vector\)岂不是又方便又能够解决哈希冲突？没错，我也喜欢用\(vector\)。这两种你用哪种都不要紧，不过仍是先提醒一下：\(vector\)有可能会爆哦！这也是为何你们用链式前向星而不用\(vector\)的缘由！（因此我也要开始习惯用链地址法了）。
创建一个公共溢出区：这个方法我不会！（~~不会还义正词严……~~）因此这里不讲，并且这个方法最后获得的模数不是一个质数，并且其因数不少，是2的次幂，因此……出题人卡你是很容易的！

解决哈希冲突的方法通常就是这些啦！还有个问题，上面提到模数要是质数，为何呢？缘由很简单，根据质数的特性，质数每个位置都能很好的利用起来，而合数不能够。并且这个质数要大一点（废话，你来个19，玩个鬼哦）。
好，讲完了基础的，来看一看例题：
P3370 【模板】字符串哈希
噫，刚刚只说了整数哈希啊！不要紧，记得ASCII码吗？咱们能够经过ASCII码，将其转成一个\(base\)进制数，固然，是模过的。而后再用链地址法，对同一哈希值的字符串进行遍历，若是都不相同，加入并更新答案。
具体代码实现：spa

#include<cstdio>
#include<string>
#include<vector>
#include<iostream>
#define mod 23333
#define base 298
#define rg register
using namespace std;
int n,ans;
string s;
vector<string>v[mod+5];
void insert()
{
	int hash=1;//记录哈希值，因为后面要乘因此初值是1
	for(rg int i=0;i<s.length();i++)
		hash=(1ll*hash*base+s[i])%mod;//1ll就是(long long)1，乘一个1ll，能够保证不爆精度（固然你爆long long或高精度我也没办法）
	string t=s;//暂存一下
	for(rg int i=0;i<v[hash].size();i++)
		if(v[hash][i]==t) return ;//判断，若是有相同的就退出
	v[hash].push_back(t);//加入新的字符串
	ans++;//更新答案
	return ;
}
int main()
{
	scanf("%d",&n);
	for(rg int i=1;i<=n;i++)
	{
		cin>>s;
		insert();
	}
	printf("%d",ans);
	return 0;
}

哦对了，通常233333（2后面跟一堆3）、100007（1和7中间隔一堆0）、1000009（1和9中间隔一堆0）都是质数。翻译

就讲这么多吧，以后就要靠你们本身实现了！重点仍是在多刷题啊！code