谷歌面试题：如何从无序链表中移除重复项？

时间 2021-01-26

标签算法 ide 函数性能 spa 指针 code orm blog 递归栏目 Chrome 繁體版

原文原文链接

一位小伙伴来问一道谷歌的笔试题，关于单链表操做的，问到底有多少种解决方案，今天咱们就来聊聊。算法

题目的大体意思是：ide

假设存在一个无序单链表，将重复结点去除后，并保原顺序。去重前：1→3→1→5→5→7去重后：1→3→5→7函数

经过双重循环直接在链表上执行删除操做。外层循环用一个指针从第一个结点开始遍历整个链表，而后内层循环用另一个指针遍历其他结点，将与外层循环遍历到的指针所指结点的数据域相同的结点删除，以下图所示。性能

假设外层循环从outerCur开始遍历，当内层循环指针innerCur遍历到上图实线所示的位置（outerCur.data==innerCur.data）时，此时须要把innerCur指向的结点删除。spa

具体步骤以下：指针

实现代码以下：递归

运行结果：

算法性能分析

因为这种方法采用双重循环对链表进行遍历，所以，时间复杂度为O（N^2）。其中，N为链表的长度。在遍历链表的过程当中，使用了常量个额外的指针变量来保存当前遍历的结点、前驱结点和被删除的结点，所以，空间复杂度为O（1）。

主要思路为：对于结点cur，首先递归地删除以cur.next为首的子链表中重复的结点，接着从以cur.next为首的子链表中找出与cur有着相同数据域的结点并删除。

实现代码以下：

算法性能分析

这种方法与方法一相似，从本质上而言，因为这种方法须要对链表进行双重遍历，所以，时间复杂度为O（N^2）。其中，N为链表的长度。因为递归法会增长许多额外的函数调用，所以，从理论上讲，该方法效率比前面的方法低。

一般状况下，为了下降时间复杂度，每每在条件容许的状况下，经过使用辅助空间实现。

具体而言，主要思路以下。

「引伸：如何从有序链表中移除重复项？」

如链表：1,三、五、五、七、七、八、9

去重后：1,三、五、七、八、9

分析与解答

上述介绍的方法也适用于链表有序的状况，可是因为以上方法没有充分利用到链表有序这个条件，所以，算法的性能确定不是最优的。本题中，因为链表具备有序性，所以，不须要对链表进行两次遍历。因此，有以下思路：用cur 指向链表第一个结点，此时须要分为如下两种状况讨论。

对于无序单链表中，想要删除其中重复的结点（多个重复结点保留一个）。删除办法有按照顺序删除、使用递归方式删除以及可使用空间换时间（HashSet中元素的惟一性）。

点赞越多，bug越少~