【今日最佳leecode】无重复字符的最长子串

img

相信看了这个标题的同窗,对这道题以已经很是不陌生了,就是leecode当中的第三题,之因此要单独的写一写主要对我来讲,里面涉及到有一个滑动窗口, 散列表, 字符编码等知识点比较重要,也有几个小技巧,这里我也权当记忆巩固了,这道题也曾被Micosoft, Amazon, Bloomberg, Airbnb, Adobe做为经典面试题,包括限流, TCP拥塞都有使用到滑动窗口思想。java

题目git

给给定一个字符串,请你找出其中不含有重复字符的 最长子串 的长度。示例 1: 输入: "abcabcbb"github

输出: 3面试

解释: 由于无重复字符的最长子串是 "abc",因此其长度为 3。数据库

输入: "pwwkew"数组

输出: 3缓存

解释: 由于无重复字符的最长子串是 "wke",因此其长度为 3。markdown

举例:数据结构

img

做为大多数人,找出如图的不相同字符的最大长度,基本上判断3次,ABC长度为3,BCAD长度为4,CADC长度为3,判断到这里直接就能够给出答案了,就是4,由于CADC已经到字符串末尾了,不用再比较了。可是让程序去实现这个功能就要设计一下了。并发

根据事例提出几个问题:

①在第一轮断定了ABC都不重复,咱们怎么实现将BC做为一个总体第二轮就不须要要判断BC是不重复的子串?

②如何选取数据结构?

滑动窗口:

顾名思义,滑动窗口一般指能够动态扩容和缩容的一个窗口,如"ABCADC“这个事例,在第二轮咱们视BC为一个总体进行扩容,扩容到BCAD。

img

img

如”pwwkew“,在第二轮当PW遇到W,咱们进行缩容,直接从下一个W开始。如图所示。一般滑动窗口的实现须要结合散列表来实现来维护一个不重复子串,当获取接下来的字符若是存在在散列表中,指针右移。

img

img

img

散列表:

一般一旦涉及到出现次数,咱们能够用散列表,在Java中咱们经常使用的涉及到散列表的容器有HashMap, HashSet, HashTable等等。这里咱们能够选用HashSet,其实其它几种均可以实现。

Set<Character> occ = new HashSet<>(); // 建立一个散列表
occ.remove(s.charAt(i - 1));          // 指针右移(移除)
occ.add((s.charAt(rk + 1)));          // 指针右移(添加)
!occ.contains(s.charAt(rk + 1))       // 判断接下来的字符是否出如今散列表
复制代码

参考代码

public static int lengthOfLongestSubstring(String s) {
    // 哈希集合,记录每一个字符是否出现过
    Set<Character> occ = new HashSet<>();
    int n = s.length();
    // 右指针,初始值为 -1,至关于咱们在字符串的左边界的左侧,尚未开始移动
    int rk = -1, ans = 0;
    for (int i = 0; i < n; ++i) {
        if (i != 0) {
            // 左指针向右移动一格,移除一个字符
            occ.remove(s.charAt(i - 1));
        }
        if (ans >= n -i) {
            break;
        }
        while (rk + 1 < n && !occ.contains(s.charAt(rk + 1))) {
            // 不断地移动右指针
            occ.add((s.charAt(rk + 1)));
            ++rk;
        }
        // 第 i 到 rk 个字符是一个极长的无重复字符子串
        ans = Math.max(ans, rk - i + 1);
    }
    return ans;
}
复制代码

测试用例:

@Test
public void islengthOfLongestSubstring() {
// int i = lengthOfLongestSubstring("abcadc");
    int i = lengthOfLongestSubstring("pwwkew");
    Assert.assertNotNull(i);
}
复制代码

拓展

public int lengthOfLongestSubstring1(String s) {
        if(s==null||s.equals(""))
            return 0;
        int []map = new int[256];
        for(int i=0;i<256;i++)
            map[i]=-1;
        int len = 0, cur = 0, pre = -1;
        for(int i=0;i<s.length();i++){
            int x = s.charAt(i);
            pre = Math.max(pre,map[x]); // 记录上次比较出现过得最大值
            cur = i - pre; // 指针 - 最大值,当指针右移,i变大,他们的差值就越大;出现相同的值,pre变大
            len = Math.max(len,cur);
            map[x] = i;  // 对出现过的字符赋值为字符串下标
        }
        return len;
    }
复制代码

咱们知道,在计算机中,全部的数据在存储和运算时都要使用二进制数表示,在英语中,用128个符号编码即可以表示全部,其余语言,128个符号是不够的。一些欧洲国家决定,利用字节中闲置的最高位编入新的符号,这些欧洲国家使用的编码体系,能够表示最多256个符号。可是汉字多达10万左右,汉字使用GB2312,理论上能够表示 256 x 256 = 65536 个符号。

在本题中主要只涉及到字符串,彻底能够使用一个数组,容量大小是256,初始长度都为-1,出现过的值记录一下,pre比较出现过的值,经过右移指针与pre的差来记录最近一次最大值,len为历史最大值。

热门推荐:

文末福利,最近整理一份面试资料《Java面试通关手册》,覆盖了Java核心技术、JVM、Java并发、SSM、微服务、数据库、数据结构等等。获取方式:GitHub github.com/Tingyu-Note…,更多内容关注个人掘金,陆续奉上。

相关文章
相关标签/搜索