传送门c++
给你一个字符串\(str\),问出现次数为\(k\)的最长的子串的长度。数组
首先咱们先将字符串\(str\)的全部后缀进行排序,并求出他们两两的\(height\)数组。spa
根据\(height\)数组的含义,\(height[i]=lcp(i,i-1)\),咱们知道,假若存在一个子串出现了k次,那么一定存在一个连续的区间\([l,r],(r-l+1 \ge k-1)\),使得\(lcp(l,r) !=0\)。那么咱们他们\(lcp\)中的最小值就是答案。所以咱们发现,咱们如今要求的是\(height\)数组中,长度至少为\(k-1\)的最小值,并要使得最小值最大化。而这个显然是一个经典的划窗问题,咱们能够经过单调队列在\(\mathcal{O}(n)\)的时间复杂度中求出答案。debug
故总体的复杂度为\(\mathcal{O}(nlogn)\)code
#include <bits/stdc++.h> #define maxn 20010 using namespace std; int rk[maxn],sa[maxn],height[maxn],tmp[maxn],cnt[maxn],n,k; int str[maxn],tot=0; unordered_map<int,int>mp; unordered_map<int,bool>vis; void SA(int n,int m){ int i,j,k; n++; for(i=0;i<n+5;i++) rk[i]=sa[i]=height[i]=tmp[i]=0; for(i=0;i<m;i++) cnt[i]=0; for(i=0;i<n;i++) cnt[rk[i]=mp[str[i]]]++; for(i=1;i<m;i++) cnt[i]+=cnt[i-1]; for(i=0;i<n;i++) sa[--cnt[rk[i]]]=i; for(k=1;k<=n;k<<=1){ for(i=0;i<n;i++){ j=sa[i]-k; if(j<0) j+=n; tmp[cnt[rk[j]]++]=j; } sa[tmp[cnt[0]=0]]=j=0; for(i=1;i<n;i++){ if(rk[tmp[i]]!=rk[tmp[i-1]]||rk[tmp[i]+k]!=rk[tmp[i-1]+k]) cnt[++j]=i; sa[tmp[i]]=j; } memcpy(rk,sa,n*sizeof(int)); memcpy(sa,tmp,n*sizeof(int)); if(j>=n-1) break; } //get height[] i=0,k=0,height[0]=0; for(j=rk[0];i<n-1;i++,k++){ while(~k&&mp[str[i]]!=mp[str[sa[j-1]+k]]){ height[j]=k--; j=rk[sa[j]+1]; } } } void debug(){ //ababa // sa[1]=4,sa[2]=2,sa[3]=0,sa[4]=3,sa[5]=1 // rk[0]=3,rk[1]=5,rk[2]=2,rk[3]=4,rk[4]=1 for(int i=1;i<=n;i++){ printf("sa[%d]=%d\n",i,sa[i]); } for(int i=0;i<n;i++){ printf("rank[%d]=%d\n",i,rk[i]); } } int main() { scanf("%d%d",&n,&k); for(int i=0;i<n;i++){ scanf("%d",&str[i]); if(!mp[str[i]]) mp[str[i]]=++tot; } SA(n,tot+1); deque<int>que; int res=0; for(int i=1;i<=n;i++){ while(!que.empty()&&i-que.front()>=k-1) que.pop_front(); while(!que.empty()&&height[que.back()]>=height[i]) que.pop_back(); que.push_back(i); if(!que.empty()&&i>=k-1) res=max(res,height[que.front()]); } printf("%d\n",res); return 0; }