一切都要从 LeetCode
的第 28 题 实现 strStr()
开始提及,当本身脑子里的第一种暴力查找法写出来并 AC 以后,仍是以为不知足,决定把能找到的解法都理解了,因而便有了这个系列。算法
当我理解完四种经典的匹配算法以后,总结了一下这类操做的核心:segmentfault
将模式串
和主串
进行比较数据结构
主串
和模式串
的下一个位置失配时,优化
在模式串
中寻找一个合适的位置spa
* 若是找到,从这个位置开始与`主串`当前失配位置进行比较 * 若是未找到,从`模式串`的头部与`主串`失配位置的下一个位置进行比较
主串
中找到一个合适的位置,从新与模式串
进行比较因此总的来讲,之因此会有这么多种匹配算法,本质上就是一些大神对第1步和第3步进行了优化,这个核心思路必定要紧紧的先记在脑子里,这样以后理解优化的匹配算法就不会一脸懵逼。翻译
BF 算法,Brute-Force(暴力)法的简称,彻底没有优化,每次失配时从主串
的下一个位置进行比较,直到比较结束。3d
算法描述以下:code
模式串
和主串
从前日后比较 主串
和模式串
的下一个位置主串
的下一个位置开始与模式串
的头部从新开始比较咱们假设有 主串 ABABBBAAABABABBA 和 模式串 ABABABB ,
下面放五张图来理解一下这个过程:blog
上面这两幅图,表现的是第1步和第2步,能够看出:字符串
S[0]
和 P[0]
开始从头日后比较S[i++]
和S[j++]
上面这两幅图,则表现的时第3步,能够看出:
S[i]
和 P[j]
失配j = 0
从 P[0]
也就是模式串
头部开始与主串
的下一个位置S[i - (j - 1)]
开始继续进行匹配重复上述两步,直到下图彻底匹配或者找不到模式串为止
思路仍是很好理解的,可是代码怎么写呢?
其实我一直以为刷 LeetCode
除了巩固与提升数据结构与算法的能力以外,最重要的就是训练一种把思路翻译成代码的能力,下面我来尝试翻译一下上述的算法思路。
这个操做应该是刷题刷多了,像之前作数学题写“解”的操做
若是是循环,那么终止条件是什么,能够很快想到,只有两种终止状况:
主串
中没有找到 模式串
的匹配,此时 i = haystack.length
主串
中找到了模式串
的匹配,此时 j = needle.length
算法处理过程主要是两步,因此这里必定有一个分支结构
return -1
就行了,但要是找到了,应该怎么肯定那个 index
的值呢?根据上面成功的图,咱们能够发现,匹配的位置 8
,是等于 主串
的末尾 14
减去 模式串
的末尾 6
获得的,也就是最后匹配的那个 index = i - j
根据算法分析里的描述,很容易知道
i++; j++;
比较各自的下一位i = i - (j - 1); j = 0;
从新进行下一轮匹配至此,整个BF算法的分析与编写就完成了,虽然它是一个毫无优化的结构,可是体现出了全部字符串匹配算法的基本思想,计算机不是人,能够经过眼睛观察和大脑思考来进行定位,它只能经过一个一个字符的比较来进行断定,接下来的算法,就开始运用到一些骚操做来进行优化这个匹配的过程。
“字符串匹配算法”是“重学数据结构与算法”系列笔记中的一个章节,细分为如下几个部分,以后会陆续填坑。