Hash,通常翻译作散列、杂凑,或音译为哈希。————摘自百度百科
先来看个题:给你一坨一些键值集<key,value>
,\(key\)的范围是\([1,10^{10}]\),每次询问\(x\),回答\(key=x\)的\(value\)这种一看就知道暴力不行……因而,有些同窗会说:我会用map
!但map
的查询是 \(O(logn)\)的 QwQ。那么哈希能够怎么作呢?咱们可让\(hash[f(key)]=value\),其中\(f()\)函数被称为哈希函数。至于\(f()\)函数怎么写……想怎么写就怎么写!没错,你想怎么写就怎么写。通常有这么几种方法:ios
那么如今上面那个问题就好解决了,只要用取余数法求得\(key\)的哈希地址就能够大大压缩空间了!
可是,你不要高兴太早!相信有许多人已经看出来了,哈希的缺点很明显,就是容易出现不一样的元素有同一个哈希地址的状况,咱们通常称其为:哈希冲突。那么有什么方法能解决哈希冲突呢?有许多方法:函数
0 0 0 34 6 44 0 0
注:0表示没有元素。而后又有一个元素\(8\),获得其哈希地址也是4(即34所在的位置),那么咱们就日后挪一挪:大哥你先来的,我到后面去。因而来到了6的位置——也被占了,那么再日后移……最后到了7(即44后面那个)。而后查询时只要依次日后找就能够了。解决哈希冲突的方法通常就是这些啦!还有个问题,上面提到模数要是质数,为何呢?缘由很简单,根据质数的特性,质数每个位置都能很好的利用起来,而合数不能够。并且这个质数要大一点(废话,你来个19,玩个鬼哦)。
好,讲完了基础的,来看一看例题:
P3370 【模板】字符串哈希
噫,刚刚只说了整数哈希啊!不要紧,记得ASCII码吗?咱们能够经过ASCII码,将其转成一个\(base\)进制数,固然,是模过的。而后再用链地址法,对同一哈希值的字符串进行遍历,若是都不相同,加入并更新答案。
具体代码实现:spa
#include<cstdio> #include<string> #include<vector> #include<iostream> #define mod 23333 #define base 298 #define rg register using namespace std; int n,ans; string s; vector<string>v[mod+5]; void insert() { int hash=1;//记录哈希值,因为后面要乘因此初值是1 for(rg int i=0;i<s.length();i++) hash=(1ll*hash*base+s[i])%mod;//1ll就是(long long)1,乘一个1ll,能够保证不爆精度(固然你爆long long或高精度我也没办法) string t=s;//暂存一下 for(rg int i=0;i<v[hash].size();i++) if(v[hash][i]==t) return ;//判断,若是有相同的就退出 v[hash].push_back(t);//加入新的字符串 ans++;//更新答案 return ; } int main() { scanf("%d",&n); for(rg int i=1;i<=n;i++) { cin>>s; insert(); } printf("%d",ans); return 0; }
哦对了,通常233333(2后面跟一堆3)、100007(1和7中间隔一堆0)、1000009(1和9中间隔一堆0)都是质数。翻译
就讲这么多吧,以后就要靠你们本身实现了!重点仍是在多刷题啊!code