最长回文子串—Manacher 算法 及 python实现

最长回文子串问题:给定一个字符串,求它的最长回文子串长度。若是一个字符串正着读和反着读是同样的,那它就是回文串。
 
给定一个字符串,求它最长的回文子串长度,例如输入字符串'35534321',它的最长回文子串是'3553',因此返回 4。

最容易想到的办法是枚举出全部的子串,而后一一判断是否为回文串,返回最长的回文子串长度。不用我说,枚举实现的耗时是咱们没法忍受的。那么有没有高效查找回文子串的方法呢?答案固然是确定的,那就是中心扩展法,选择一个元素做为中心,而后向外发散的寻找以该元素为圆心的最大回文子串。可是又出现了新的问题,回文子串的长度便可能是奇数,也可能好是偶数,对于长度为偶数的回文子串来讲是不存在中心元素的。那是否有一种办法能将奇偶长度的子串归为一类,统一使用中心扩展法呢?它就是 manacher 算法,在原字符串中插入特殊字符,例如插入 #后原字符串变成'#3#5#5#3#4#3#2#1#'。如今咱们对新字符串使用中心扩展发便可,中心扩展法获得的半径就是子串的长度。python

如今实现思路已经明确了,先转化字符串'35534321'  ---->  '#3#5#5#3#4#3#2#1#',而后求出以每一个元素为中心的最长回文子串的长度。如下给出 python 实现:算法

#!/usr/bin/python
# -*- coding: utf-8 -*-

def max_substr(string):
  s_list = [s for s in string]
  string = '#' + '#'.join(s_list) + '#'
  max_length = 0
  length = len(string)
  for index in range(0, length):
    r_length = get_length(string, index)
    if max_length < r_length:
      max_length = r_length
  return max_length

def get_length(string, index):
  # 循环求出index为中心的最长回文字串
  length = 0
  r_ = len(string)
  for i in range(1,index+1):
    if index+i < r_ and string[index-i] == string[index+i]:
      length += 1
    else:
      break
  return length

if __name__ == "__main__":
  result = max_substr("35534321")
  print result

功能已经实现了,通过测试也没有 bug,可是咱们静下心来想想,目前的解法是否还有优化空间呢?根据目前的解法,咱们求出了‘35534321‘中每一个元素中心的最大回文子串。当遍历到'4'时,咱们已经知道目前最长的回文子串的长度 max_length 是 4,这是咱们求出了以 4 为中心的最长回文子串长度是 3,它比 max_length 要小,因此咱们不更新 max_length。换句话说,咱们计算以 4 为中心的最长回文字串长度是作了无用功。这就是咱们要优化的地方,既然某个元素的最长的回文子串长度并无超过 max_length,咱们就没有必要计算它的最长回文子串,在遍历一个新的元素时,咱们要优先判断以它为中心的回文子串的长度是否能超越 max_length,若是不能超过,就继续遍历下一个元素。如下是优化后的实现:ide

#!/usr/bin/python
# -*- coding: utf-8 -*-

def max_substr(string):
  s_list = [s for s in string]
  string = '#' + '#'.join(s_list) + '#'
  max_length = 0
  length = len(string)
  for index in range(0, length):
    r_length = get_length2(string, index, max_length)
    if max_length < r_length:
      max_length = r_length
  return max_length

def get_length2(string, index, max_length):
  # 基于已知的最长字串求最长字串
  # 1.中心+最大半径超出字符串范围, return
  r_ = len(string)
  if index + max_length > r_:
    return max_length

  # 2.没法超越最大半径, return
  l_string = string[index - max_length + 1 : index + 1]
  r_string = string[index : index + max_length]
  if l_string != r_string[::-1]:
    return max_length

  # 3.计算新的最大半径
  result = max_length
  for i in range(max_length, r_):
    if index-i >= 0 and index+i < r_ and string[index-i] == string[index+i]:
      result += 1
    else:
      break
  return result - 1

if __name__ == "__main__":
  result = max_substr("35534321")
  print result
View Code
相关文章
相关标签/搜索