KMP算法 Next数组详解

题面

题目描述

如题,给出两个字符串s1和s2,其中s2为s1的子串,求出s2在s1中全部出现的位置。html

为了减小骗分的状况,接下来还要输出子串的前缀数组next。若是你不知道这是什么意思也不要问,去百度搜[kmp算法]学习一下就知道了。
输入输出格式ios

输入格式:

第一行为一个字符串,即为s1(仅包含大写字母)算法

第二行为一个字符串,即为s2(仅包含大写字母)数组

输出格式:

若干行,每行包含一个整数,表示s2在s1中出现的位置学习

接下来1行,包括length(s2)个整数,表示前缀数组next[i]的值。spa

输入样例:

ABABABC
ABAcode

输出样例:

1
3
0 0 1htm

说明

时空限制:1000ms,128M
数据规模:
设s1长度为N,s2长度为M
对于30%的数据:N<=15,M<=5
对于70%的数据:N<=10000,M<=100
对于100%的数据:N<=1000000,M<=1000blog

题解

这是一道KMP裸题(模板题。。)
我就是拿着它学习一下KMP算法
其实原来我学过KMP算法
可是一直没有弄懂next(跳转)数组是如何求出来的。
最近花了一个下午本身研究了一下KMP算法
如今终于以为KMP很简单了~




如今直接说next数组把
至于有什么做用,next数组是干什么的,请自行百度,有不少dalao总结的很是到位,看一看就会明白。


好,来讲next数组


这里写图片描述


并不用在乎这一坨黑的是什么东西,咱们就假设他是咱们要求next数组的字符串。


next数组求的东西就是从起始位置到当前位置最长的相等的前缀和后缀的长度。
(举个例子China的前缀有:C、Ch、Chi、Chin、China ; 后缀有a、na、ina、hina、China)图片

这里写图片描述




咱们继续,如上图红色的是当前位置(设为j)前,所匹配上的最长前缀和后缀,蓝色的是当前要匹配的位置。

这里写图片描述

那么,咱们就拿当前位置和原来匹配到的最长前缀的后一位相比较
若是两个位置相同,
显然,
能够和前面的红色连在一块儿,
此时就有next[j]=next[j-1]+1

若是两个位置不相同,
根据next数组的性质,
显然的,你的当前的相等的前缀和后缀只可以继续向前找,
也就是说,你当前的next数组必定会减少。

这里写图片描述


既然前面的红色部分存在一小块灰色,那么,后面的红色部分也必然存在灰色部分。


这里写图片描述




因此,判断当前位置和前面那一块灰色的前缀的后一位是否相等。
若是这两位相同的话,不就能够和前面的灰色部分连在一块儿了吗


这里写图片描述

此时,又回到一开始的那一步。
所以,求解某个位置的next值是一个循环过程。
不断检查 上一位的 最长前缀的 后一位(i位置)(这句子有点拗口)
若是相等next[j]=next[i]+1
不然令 i=next[i-1]+1,继续循环匹配

若是没有看懂就本身多看几遍,本身找几个字符串算一算

因此:求解next数组的代码:

inline void GetNext(string s)//得到字符串s的next数组
{
    int l=s.length(),t;
    Next[0]=-1;//若是在0位置失配则是向下移动一位
    for(int i=1;i<l;++i)//依次求解后面的next数组
    {
        t=Next[i-1];
        while(s[t+1]!=s[i]&&t>=0)//循环求解next值 
            t=Next[t];
        if(s[t+1]==s[i])//若是是匹配上而退出循环 
            Next[i]=t+1;
        else            //不然则是匹配不上 
            Next[i]=-1; //指向头 
    }
}




代码很简洁的~
那么,接下来如何利用Next数组求解匹配
那就本身baidu吧(知道了next数组,KMP就很好理解了)

接下来贴上小蒟蒻的源码

#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<cmath>
#include<vector>
#include<algorithm>
using namespace std;
const int MAX=1001;
int Next[MAX];
vector<int> Ans;
inline void GetNext(string s)//得到字符串s的next数组
{
    int l=s.length(),t;
    Next[0]=-1;//若是在0位置失配则是向下移动一位
    for(int i=1;i<l;++i)//依次求解后面的next数组
    {
        t=Next[i-1];
        while(s[t+1]!=s[i]&&t>=0)//循环求解next值 
            t=Next[t];
        if(s[t+1]==s[i])//若是是匹配上而退出循环 
            Next[i]=t+1;
        else            //不然则是匹配不上 
            Next[i]=-1; //指向头 
    }
}
inline void KMP(string s1,string s2)
{
    GetNext(s2);
    int l1=s1.length();
    int l2=s2.length();
    int i=0,j=0;
    while(j<l1)
    {
        if(s2[i]==s1[j])//当前位匹配成功,继续匹配下一位
        {
            ++i;++j;
            if(i==l2)//彻底匹配
            {
                Ans.push_back(j-l2+1);//储存答案
                i=Next[i-1]+1;//继续匹配                
            }
        }
        else
        {
            if(i==0)//在首位不匹配
                j++;//直接向后挪一位
            else
                i=Next[i-1]+1;//跳转
        }
    }
}
int main()
{
    string s1,s2;
    int l;
    cin>>s1>>s2;
    l=s2.length();
    KMP(s1,s2);
    for(int i=0;i<Ans.size();++i)
        cout<<Ans[i]<<endl;
    for(int i=0;i<l;++i)
        cout<<Next[i]+1<<' ';
    cout<<endl;
    return 0;
}

最后再说一句
若是须要加深理解KMP的过程
请去SYC的blog看看他的gif动图
你可能就会有更多了解
膜拜SYC大佬去

相关文章
相关标签/搜索