关于我
编程界的一名小小程序猿,目前在一个创业团队任team lead,技术栈涉及Android、Python、Java和Go,这个也是咱们团队的主要技术栈。 联系:hylinux1024@gmail.comlinux
栈、队列和优先级队列都是很是基础的数据结构。Python
做为一种“编码高效”的语言,对这些基础的数据结构都有比较好的实现。在业务需求开发过程当中,不该该重复造轮子,今天就来看看些数据结构都有哪些实现。编程
栈是一种LIFO
(后进先出)的数据结构,有入栈(push
)、出栈(pop
)两种操做,且只能操做栈顶元素。小程序
在Python
中有多种能够实现栈的数据结构。数组
list
是Python
内置的列表数据结构,它支持栈的特性,有入栈和出栈操做。只不过用list
实现栈性能不是特别好。
由于list
内部是经过一个动态扩容的数组来实现的。当增减元素时就有可能会触发扩容操做。若是在list
的头部增减元素,也会移动整个列表。安全
如要使用list
来实现一个栈的话,可使用list
的append()
(入栈)、pop()
(出栈)方法。数据结构
>>> s = []
>>> s.append('one')
>>> s.append('two')
>>> s.append(3)
>>> s
['one', 'two', 3]
>>> s.pop()
3
>>> s.pop()
'two'
>>> s.pop()
'one'
>>> s.pop()
IndexError: pop from empty list
复制代码
deque
类是一种双端队列。在Python
中它就是一个双向列表,能够以经常使用时间在两端执行添加和删除元素的操做,很是高效,因此它既能够实现栈也能够实现队列。并发
若是要在Python
实现一个栈,那么应该优先选择deque
,而不是list
。app
deque
的入栈和出栈方法也分别是append()
和pop()
。性能
>>> from collections import deque
>>> s = deque()
>>> s.append('eat')
>>> s.append('sleep')
>>> s.append('code')
>>> s
deque(['eat', 'sleep', 'code'])
>>> s.pop()
'code'
>>> s.pop()
'sleep'
>>> s.pop()
'eat'
>>> s.pop()
IndexError: pop from an empty deque
复制代码
顾名思义,这个就是一个栈。不过它是线程安全的,若是要在并发的环境下使用,那么就能够选择使用LifoQueue
。 它入栈和出栈操做是使用put()
和get()
,其中get()
在LifoQueue
为空时会阻塞。学习
>>> from queue import LifoQueue
>>> s = LifoQueue()
>>> s.put('eat')
>>> s.put('sleep')
>>> s.put('code')
>>> s
<queue.LifoQueue object at 0x109dcfe48>
>>> s.get()
'code'
>>> s.get()
'sleep'
>>> s.get()
'eat'
>>> s.get()
# 阻塞并一直等待直到栈不为空
复制代码
队列是一种FIFO
(先进先出)的数据结构。它有入队(enqueue
)、出队(dequeue
)两种操做,并且也是常数时间的操做。
在Python
中可使用哪些数据结构来实现一个队列呢?
list
能够实现一个队列,但它的入队、出队操做就不是很是高效了。由于list
是一个动态列表,在队列的头部执行出队操做时,会发生整个元素的移动。
使用list
来实现一个队列时,用append()
执行入队操做,使用pop(0)
方法在队列头部执行出队操做。因为在list
的第一个元素进行操做,因此后续的元素都会向前移动一位。所以用list
来实现队列是不推荐的。
>>> q = []
>>> q.append('1')
>>> q.append('2')
>>> q.append('three')
>>> q.pop(0)
'1'
>>> q.pop(0)
'2'
>>> q.pop(0)
'three'
>>> q.pop(0)
IndexError: pop from empty list
复制代码
从上文咱们已经知道deque
是一个双向列表,它能够在列表两端以常数时间进行添加删除操做。因此用deque
来实现一个队列是很是高效的。
deque
入队操做使用append()
方法,出队操做使用popleft()
方法。
>>> from collections import deque
>>> q = deque()
>>> q.append('eat')
>>> q.append('sleep')
>>> q.append('code')
>>> q
deque(['eat', 'sleep', 'code'])
# 使用popleft出队
>>> q.popleft()
'eat'
>>> q.popleft()
'sleep'
>>> q.popleft()
'code'
>>> q.popleft()
IndexError: pop from an empty deque
复制代码
一样地,若是要在并发环境下使用队列,那么选择线程安全的queue.Queue
。
与LifoQueue
相似,入队和出队操做分别是put()
和get()
方法,get()
在队列为空时会一直阻塞直到有元素入队。
>>> from queue import Queue
>>> q = Queue()
>>> q.put('eat')
>>> q.put('sleep')
>>> q.put('code')
>>> q
<queue.Queue object at 0x110564780>
>>> q.get()
'eat'
>>> q.get()
'sleep'
>>> q.get()
'code'
# 队列为空不要执行等待
>>> q.get_nowait()
_queue.Empty
>>> q.put('111')
>>> q.get_nowait()
'111'
>>> q.get()
# 队列为空时,会一直阻塞直到队列不为空
复制代码
多进程版本的队列。若是要在多进程环境下使用队列,那么应该选择multiprocessing.Queue
。
一样地,它的入队出队操做分别是put()
和get()
。get()
方法在队列为空,会一直阻塞直到队列不为空。
>>> from multiprocessing import Queue
>>> q = Queue()
>>> q.put('eat')
>>> q.put('sleep')
>>> q.put('code')
>>> q
<multiprocessing.queues.Queue object at 0x110567ef0>
>>> q.get()
'eat'
>>> q.get()
'sleep'
>>> q.get()
'code'
>>> q.get_nowait()
_queue.Empty
>>> q.get()
# 队列为空时,会一直阻塞直到队列不为空
复制代码
一个近乎排序的序列里可使用优先级队列这种数据结构,它能高效获取最大或最小的元素。
在调度问题的场景中常常会用到优先级队列。它主要有获取最大值或最小值的操做和入队操做。
使用list
能够实现一个优先级队列,但它并不高效。由于当要获取最值时须要排序,而后再获取最值。一旦有新的元素加入,再次获取最值时,又要从新排序。因此并推荐使用。
通常来讲,优先级队列都是使用堆这种数据结构来实现。而heapq
就是Python
标准库中堆的实现。heapq
默认状况下实现的是最小堆。
入队操做使用heappush()
,出队操做使用heappop()
。
>>> import heapq
>>> q = []
>>> heapq.heappush(q, (2, 'code'))
>>> heapq.heappush(q, (1, 'eat'))
>>> heapq.heappush(q, (3, 'sleep'))
>>> q
[(1, 'eat'), (2, 'code'), (3, 'sleep')]
>>> while q:
next_item = heapq.heappop(q)
print(next_item)
(1, 'eat')
(2, 'code')
(3, 'sleep')
复制代码
queue.PriorityQueue
内部封装了heapq
,不一样的是它是线程安全的。在并发环境下应该选择使用PriorityQueue
。
>>> from queue import PriorityQueue
>>> q = PriorityQueue()
>>> q.put((2, 'code'))
>>> q.put((1, 'eat'))
>>> q.put((3, 'sleep'))
>>> while not q.empty():
next_item = q.get()
print(next_item)
(1, 'eat')
(2, 'code')
(3, 'sleep')
复制代码
不少基础的数据结构在Python
中已经实现了的,咱们不该该重复造轮子,应该选择这些数据结构来实现业务需求。
collections.deque
是一种双向链表,在单线程的状况下,它能够用来实现Stack
和Queue
。而heapq
模块能够帮咱们实现高效的优先级队列。
若是要在多并发的状况下使用Stack
、Queue
和PriorityQueue
的话,那么应该选用queue
模块下类:
Stack
的queue.LifoQueue
Queue
的queue.Queue
或multiprocessing.Queue
PriorityQueue
的queue.PriorityQueue
put()
和get()
方法,且get()
会在栈/队列为空时阻塞。