谷歌面试题:如何从无序链表中移除重复项?

一位小伙伴来问一道谷歌的笔试题,关于单链表操做的,问到底有多少种解决方案,今天咱们就来聊聊。算法

题目的大体意思是:ide

假设存在一个无序单链表,将重复结点去除后,并保原顺序。去重前:1→3→1→5→5→7去重后:1→3→5→7函数

顺序删除

经过双重循环直接在链表上执行删除操做。外层循环用一个指针从第一个结点开始遍历整个链表,而后内层循环用另一个指针遍历其他结点,将与外层循环遍历到的指针所指结点的数据域相同的结点删除,以下图所示。性能

假设外层循环从outerCur开始遍历,当内层循环指针innerCur遍历到上图实线所示的位置(outerCur.data==innerCur.data)时,此时须要把innerCur指向的结点删除。spa

具体步骤以下:指针

  • 用tmp记录待删除的结点的地址。code

  • 为了可以在删除tmp结点后继续遍历链表中其他的结点,使innerCur指针指向它的后继结点:innerCur=innerCur.nextorm

  • 从链表中删除tmp结点。blog

实现代码以下:递归


img



img



img


运行结果:


img


算法性能分析

因为这种方法采用双重循环对链表进行遍历,所以,时间复杂度为O(N^2)。其中,N为链表的长度。在遍历链表的过程当中,使用了常量个额外的指针变量来保存当前遍历的结点、前驱结点和被删除的结点,所以,空间复杂度为O(1)

递归法

主要思路为:对于结点cur,首先递归地删除以cur.next为首的子链表中重复的结点,接着从以cur.next为首的子链表中找出与cur有着相同数据域的结点并删除。

实现代码以下:


img



img



img


算法性能分析

这种方法与方法一相似,从本质上而言,因为这种方法须要对链表进行双重遍历,所以,时间复杂度为O(N^2)。其中,N为链表的长度。因为递归法会增长许多额外的函数调用,所以,从理论上讲,该方法效率比前面的方法低。

空间换时间

一般状况下,为了下降时间复杂度,每每在条件容许的状况下,经过使用辅助空间实现。

具体而言,主要思路以下。

  • 创建一个HashSet,HashSet中的内容为已经遍历过的结点内容,并将其初始化为空。

  • 从头开始遍历链表中的因此结点,存在如下两种可能性:

  • 若是结点内容已经在HashSet中,则删除此结点,继续向后遍历。

  • 若是结点内容不在HashSet中,则保留此结点,将此结点内容添加到HashSet中,继续向后遍历。

「引伸:如何从有序链表中移除重复项?」

如链表:1,三、五、五、七、七、八、9

去重后:1,三、五、七、八、9

分析与解答

上述介绍的方法也适用于链表有序的状况,可是因为以上方法没有充分利用到链表有序这个条件,所以,算法的性能确定不是最优的。本题中,因为链表具备有序性,所以,不须要对链表进行两次遍历。因此,有以下思路:用cur 指向链表第一个结点,此时须要分为如下两种状况讨论。

  • 若是cur.data==cur.next.data,那么删除cur.next结点。

  • 若是cur.data!=cur.next.data,那么cur=cur.next,继续遍历其他结点。

总结

对于无序单链表中,想要删除其中重复的结点(多个重复结点保留一个)。删除办法有按照顺序删除、使用递归方式删除以及可使用空间换时间(HashSet中元素的惟一性)。

点赞越多,bug越少~

相关文章
相关标签/搜索