C++ 容器：顺序性容器、关联式容器和容器适配器

时间 2019-11-20

标签 c++ 容器顺序关联适配器栏目 C&C++ 繁體版

原文原文链接

转载自：blog.csdn.net/acosoft算法

什么是容器后端

首先，咱们必须理解一下什么是容器，在C++ 中容器被定义为：在数据存储上，有一种对象类型，它能够持有其它对象或指向其它对像的指针，这种对象类型就叫作容器。很简单，容器就是保存其它对象的对象，固然这是一个朴素的理解，这种“对象”还包含了一系列处理“其它对象”的方法，由于这些方法在程序的设计上会常常被用到，因此容器也体现了一个好处，就是“容器类是一种对特定代码重用问题的良好的解决方案”。数组

容器还有另外一个特色是容器能够自行扩展。在解决问题时咱们经常不知道咱们须要存储多少个对象，也就是说咱们不知道应该建立多大的内存空间来保存咱们的对象。显然，数组在这一方面也力不从心。容器的优点就在这里，它不须要你预先告诉它你要存储多少对象，只要你建立一个容器对象，并合理的调用它所提供的方法，全部的处理细节将由容器来自身完成。它能够为你申请内存或释放内存，而且用最优的算法来执行您的命令。数据结构

容器是随着面向对象语言的诞生而提出的，容器类在面向对象语言中特别重要，甚至它被认为是早期面向对象语言的基础。在如今几乎全部的面向对象的语言中也都伴随着一个容器集，在C++ 中，就是标准模板库（STL ）。函数

和其它语言不同，C++ 中处理容器是采用基于模板的方式。标准C++ 库中的容器提供了多种数据结构，这些数据结构能够与标准算法一块儿很好的工做，这为咱们的软件开发提供了良好的支持！性能

通用容器的分类优化

STL 对定义的通用容器分三类：顺序性容器、关联式容器和容器适配器。spa

顺序性容器 是一种各元素之间有顺序关系的线性表，是一种线性结构的可序群集。顺序性容器中的每一个元素均有固定的位置，除非用删除或插入的操做改变这个位置。这个位置和元素自己无关，而和操做的时间和地点有关，顺序性容器不会根据元素的特色排序而是直接保存了元素操做时的逻辑顺序。好比咱们一次性对一个顺序性容器追加三个元素，这三个元素在容器中的相对位置和追加时的逻辑次序是一致的。.net

关联式容器 和顺序性容器不同，关联式容器是非线性的树结构，更准确的说是二叉树结构。各元素之间没有严格的物理上的顺序关系，也就是说元素在容器中并无保存元素置入容器时的逻辑顺序。可是关联式容器提供了另外一种根据元素特色排序的功能，这样迭代器就能根据元素的特色“顺序地”获取元素。设计

关联式容器另外一个显著的特色是它是以键值的方式来保存数据，就是说它能把关键字和值关联起来保存，而顺序性容器只能保存一种（能够认为它只保存关键字，也能够认为它只保存值）。这在下面具体的容器类中能够说明这一点。

容器适配器 是一个比较抽象的概念， C++的解释是：适配器是使一事物的行为相似于另外一事物的行为的一种机制。容器适配器是让一种已存在的容器类型采用另外一种不一样的抽象类型的工做方式来实现的一种机制。其实仅是发生了接口转换。那么你能够把它理解为容器的容器，它实质仍是一个容器，只是他不依赖于具体的标准容器类型，能够理解是容器的模版。或者把它理解为容器的接口，而适配器具体采用哪一种容器类型去实现，在定义适配器的时候能够由你决定。

下表列出STL 定义的三类容器所包含的具体容器类：

标准容器类	特色
顺序性容器
vector	从后面快速的插入与删除，直接访问任何元素
deque	从前面或后面快速的插入与删除，直接访问任何元素
list	双链表，从任何地方快速插入与删除
关联容器
set	快速查找，不容许重复值
multiset	快速查找，容许重复值
map	一对多映射，基于关键字快速查找，不容许重复值
multimap	一对多映射，基于关键字快速查找，容许重复值
容器适配器
stack	后进先出
queue	先进先出
priority_queue	最高优先级元素老是第一个出列

顺序性容器

向量 vector ：

是一个线性顺序结构。至关于数组，但其大小能够不预先指定，而且自动扩展。它能够像数组同样被操做，因为它的特性咱们彻底能够将vector 看做动态数组。
在建立一个vector 后，它会自动在内存中分配一块连续的内存空间进行数据存储，初始的空间大小能够预先指定也能够由vector 默认指定，这个大小即capacity （）函数的返回值。当存储的数据超过度配的空间时vector 会从新分配一块内存块，但这样的分配是很耗时的，在从新分配空间时它会作这样的动做：

首先，vector 会申请一块更大的内存块；

而后，将原来的数据拷贝到新的内存块中；

其次，销毁掉原内存块中的对象（调用对象的析构函数）；

最后，将原来的内存空间释放掉。

若是vector 保存的数据量很大时，这样的操做必定会致使糟糕的性能（这也是vector 被设计成比较容易拷贝的值类型的缘由）。因此说vector 不是在什么状况下性能都好，只有在预先知道它大小的状况下vector 的性能才是最优的。

vector 的特色：
(1) 指定一块如同数组同样的连续存储，但空间能够动态扩展。即它能够像数组同样操做，而且能够进行动态操做。一般体如今push_back() pop_back() 。
(2) 随机访问方便，它像数组同样被访问，即支持[ ] 操做符和vector.at()
(3) 节省空间，由于它是连续存储，在存储数据的区域都是没有被浪费的，可是要明确一点vector 大多状况下并非满存的，在未存储的区域实际是浪费的。

(4) 在内部进行插入、删除操做效率很是低，这样的操做基本上是被禁止的。Vector 被设计成只能在后端进行追加和删除操做，其缘由是vector 内部的实现是按照顺序表的原理。
(5) 只能在vector 的最后进行push 和pop ，不能在vector 的头进行push 和pop 。
(6) 当动态添加的数据超过vector 默认分配的大小时要进行内存的从新分配、拷贝与释放，这个操做很是消耗性能。因此要vector 达到最优的性能，最好在建立vector 时就指定其空间大小。

双向链表list

是一个线性链表结构，它的数据由若干个节点构成，每个节点都包括一个信息块（即实际存储的数据）、一个前驱指针和一个后驱指针。它无需分配指定的内存大小且能够任意伸缩，这是由于它存储在非连续的内存空间中，而且由指针将有序的元素连接起来。

因为其结构的缘由，list 随机检索的性能很是的很差，由于它不像vector 那样直接找到元素的地址，而是要从头一个一个的顺序查找，这样目标元素越靠后，它的检索时间就越长。检索时间与目标元素的位置成正比。

虽然随机检索的速度不够快，可是它能够迅速地在任何节点进行插入和删除操做。由于list 的每一个节点保存着它在链表中的位置，插入或删除一个元素仅对最多三个元素有所影响，不像vector 会对操做点以后的全部元素的存储地址都有所影响，这一点是vector 不可比拟的。

list 的特色：
(1) 不使用连续的内存空间这样能够随意地进行动态操做；
(2) 能够在内部任何位置快速地插入或删除，固然也能够在两端进行push 和pop 。
(3) 不能进行内部的随机访问，即不支持[ ] 操做符和vector.at() ；
(4) 相对于verctor 占用更多的内存。

双端队列deque
是一种优化了的、对序列两端元素进行添加和删除操做的基本序列容器。它容许较为快速地随机访问，但它不像vector 把全部的对象保存在一块连续的内存块，而是采用多个连续的存储块，而且在一个映射结构中保存对这些块及其顺序的跟踪。向deque 两端添加或删除元素的开销很小。它不须要从新分配空间，因此向末端增长元素比vector 更有效。

实际上，deque 是对vector 和list 优缺点的结合，它是处于二者之间的一种容器。

deque 的特色：
(1) 随机访问方便，即支持[ ] 操做符和vector.at() ，但性能没有vector 好；
(2) 能够在内部进行插入和删除操做，但性能不及list ；
(3) 能够在两端进行push 、pop ；

三者的比较

下图描述了vector 、list 、deque 在内存结构上的特色：

vector 是一段连续的内存块，而deque 是多个连续的内存块， list 是全部数据元素分开保存，能够是任何两个元素没有连续。

vector 的查询性能最好，而且在末端增长数据也很好，除非它从新申请内存段；适合高效地随机存储。

list 是一个链表，任何一个元素均可以是不连续的，但它都有两个指向上一元素和下一元素的指针。因此它对插入、删除元素性能是最好的，而查询性能很是差；适合大量地插入和删除操做而不关心随机存取的需求。

deque 是介于二者之间，它兼顾了数组和链表的优势，它是分块的链表和多个数组的联合。因此它有被list 好的查询性能，有被vector 好的插入、删除性能。若是你须要随即存取又关心两端数据的插入和删除，那么deque 是最佳之选。

关联容器

set, multiset, map, multimap 是一种非线性的树结构，具体的说采用的是一种比较高效的特殊的平衡检索二叉树—— 红黑树结构。（至于什么是红黑树，我也不太理解，只能理解到它是一种二叉树结构）

由于关联容器的这四种容器类都使用同一原理，因此他们核心的算法是一致的，可是它们在应用上又有一些差异，先描述一下它们之间的差异。

set ，又称集合，实际上就是一组元素的集合，但其中所包含的元素的值是惟一的，且是按必定顺序排列的，集合中的每一个元素被称做集合中的实例。由于其内部是经过链表的方式来组织，因此在插入的时候比vector 快，但在查找和末尾添加上被vector 慢。

multiset ，是多重集合，其实现方式和set 是类似的，只是它不要求集合中的元素是惟一的，也就是说集合中的同一个元素能够出现屡次。

map ，提供一种“键- 值”关系的一对一的数据存储能力。其“键”在容器中不可重复，且按必定顺序排列（其实咱们能够将set 也当作是一种键- 值关系的存储，只是它只有键没有值。它是map 的一种特殊形式）。因为其是按链表的方式存储，它也继承了链表的优缺点。

multimap ，和map 的原理基本类似，它容许“键”在容器中能够不惟一。

关联容器的特色是明显的，相对于顺序容器，有如下几个主要特色：

1，其内部实现是采用非线性的二叉树结构，具体的说是红黑树的结构原理实现的；

2， set 和map 保证了元素的惟一性，mulset 和mulmap 扩展了这一属性，能够容许元素不惟一；

3，元素是有序的集合，默认在插入的时候按升序排列。

基于以上特色，

1，关联容器对元素的插入和删除操做比vector 要快，由于vector 是顺序存储，而关联容器是链式存储；比list 要慢，是由于即便它们同是链式结构，但list 是线性的，而关联容器是二叉树结构，其改变一个元素涉及到其它元素的变更比list 要多，而且它是排序的，每次插入和删除都须要对元素从新排序；

2，关联容器对元素的检索操做比vector 慢，可是比list 要快不少。vector 是顺序的连续存储，固然是比不上的，但相对链式的list 要快不少是由于list 是逐个搜索，它搜索的时间是跟容器的大小成正比，而关联容器查找的复杂度基本是Log(N) ，好比若是有1000 个记录，最多查找10 次，1,000,000 个记录，最多查找20 次。容器越大，关联容器相对list 的优越性就越能体现；

3，在使用上set 区别于vector,deque,list 的最大特色就是set 是内部排序的，这在查询上虽然逊色于vector ，可是却大大的强于list 。

4，在使用上map 的功能是不可取代的，它保存了“键- 值”关系的数据，而这种键值关系采用了类数组的方式。数组是用数字类型的下标来索引元素的位置，而map 是用字符型关键字来索引元素的位置。在使用上map 也提供了一种类数组操做的方式，即它能够经过下标来检索数据，这是其余容器作不到的，固然也包括set 。（STL 中只有vector 和map 能够经过类数组的方式操做元素，即如同ele[1] 方式）

容器适配器

STL 中包含三种适配器：栈stack 、队列queue 和优先级priority_queue 。

适配器是容器的接口，它自己不能直接保存元素，它保存元素的机制是调用另外一种顺序容器去实现，便可以把适配器看做“它保存一个容器，这个容器再保存全部元素”。

STL 中提供的三种适配器能够由某一种顺序容器去实现。默认下stack 和queue 基于deque 容器实现，priority_queue 则基于vector 容器实现。固然在建立一个适配器时也能够指定具体的实现容器，建立适配器时在第二个参数上指定具体的顺序容器能够覆盖适配器的默认实现。

因为适配器的特色，一个适配器不是能够由任一个顺序容器均可以实现的。

栈stack 的特色是后进先出，因此它关联的基本容器能够是任意一种顺序容器，由于这些容器类型结构均可以提供栈的操做有求，它们都提供了push_back 、pop_back 和back 操做；

队列queue 的特色是先进先出，适配器要求其关联的基础容器必须提供pop_front 操做，所以其不能创建在vector 容器上；

优先级队列priority_queue 适配器要求提供随机访问功能，所以不能创建在list 容器上。