python手刃lintcode(128) :哈希函数【简单题】

python手刃lintcode(128) :哈希函数【简单题】

这道题没有什么算法难点,公式已经给出了,重点是一些函数的使用和时间复杂度的问题。python

字符串转换函数:算法

  • ord(c):参数是长度为1的字符串,简称字符。当参数为统一对象时(unicode object),返回能表明该字符的统一编码,当参数为8比特的字符串时,返回该字节的值。例如,ord('a')返回整形数值97,ord(u'\u2020')返回8224。
  • chr(i):返回一个字符,字符的ascii码等于参数中的整形数值。例如chr(97)返回字符'a',该方法是ord()的反方法。参数必须是0-255的整形数值,不然会抛出valueError错误。

注意这里不能用int() 函数进行转化,由于该函数的输入值只是时数字。函数

class Solution:
    """ @param key: A string you should hash @param HASH_SIZE: An integer @return: An integer """
    def hashCode(self, key, HASH_SIZE):
        # write your code here
        n = len(key)
        num = 0
        for i in range(n):
            num += ord(key[i])*(33**(n-i-1))
        num = num % HASH_SIZE
        return num
复制代码

可是上边这个程序会报超时的错误,接下来考虑怎么下降时间复杂度。由于自己的转换公式已经给定了,因此能下降复杂度的方法也就是从计算顺序等方面着手。编码

下降时间复杂度方法:spa

  1. 若是从前日后顺次转化,那么能够发现要从 33^{n-1} 算到 33^{0} ,即须要计算n(n-1)/2 次,因此咱们能够改变一下顺序,从后往前进行转换,并保留每次计算的33次方的值,在下一次计算时再乘以33便可,这样只须要计算 n-1 次便可,能够下降时间复杂度。
  2. 对于转换公式:

hashcode(“abcd”) = (ascii(a) * 333 + ascii(b) * 332 + ascii(c) *33 + ascii(d)) % HASH_SIZEcode

来讲,其实彻底能够对每一项先取余再相加(能除就尽可能先除),这样能够减小内存占用和计算量。对象

改进后的程序:内存

class Solution:
    """ @param key: A string you should hash @param HASH_SIZE: An integer @return: An integer """
    def hashCode(self, key, HASH_SIZE):
        # write your code here
        n = len(key)
        num = 0
        temp = 1
        for i in range(n-1,-1,-1):
            num += ord(key[i])*temp%HASH_SIZE   
            temp = temp*33 % HASH_SIZE
        num = num % HASH_SIZE
        return num
复制代码
相关文章
相关标签/搜索