数据结构与算法-day2-数组

时间 2019-11-30

标签数据结构算法 day2 day 数组繁體版

原文原文链接

个人理解

数组是一种线性表结构,下标从0开始,用来存储 同一类型 的数据,而且 在内存空间上是连续的编程

正是由于他的内存空间是连续的,因此增删时才会须要整块整块的移动

线性表就是数据排成像一条线同样的结构。每一个线性表上的数据最多只有前和后两个方向

数据在非线性表里不是简单先后关系

数组如何实现随机访问

数组支持随机访问，根据下标随机访问的时间复杂度为 O(1)。数组

咱们知道，计算机会给每一个内存单元分配一个地址，计算机经过地址来访问内存中的数据。当计算机须要随机访问数组中的某个元素时，它会首先经过下面的寻址公式，计算出该元素存储的内存地址：数据结构

a[i]_address = base_address + i * data_type_size性能

其中 data_type_size 表示数组中每一个元素的大小。咱们举的这个例子里，数组中存储的是 int 类型数据，因此 data_type_size 就为 4 个字节。优化

注意:在这里i指的是下标,更准确的说是偏移量,a[0] 就是偏移为 0 的位置，也就是首地址，a[k] 就表示偏移 k 个 type_size 的位置，因此计算 a[k] 的内存地址只须要用这个公式：3d

a[i]_address = base_address + i * data_type_sizecode

可是，若是数组从 1 开始计数，那咱们计算数组元素 a[k] 的内存地址就会变为：cdn

a[k]_address = base_address + (k-1)*type_sizeblog

对比两个公式，咱们不难发现，从 1 开始编号，每次随机访问数组元素都多了一次减法运算，对于 CPU 来讲，就是多了一次减法指令。内存

数组做为很是基础的数据结构，经过下标随机访问数组元素又是其很是基础的编程操做，效率的优化就要尽量作到极致**。因此为了减小一次减法操做，数组选择了从 0 开始编号，而不是从 1 开始。**

低效的“插入”和“删除”

前面概念部分咱们提到，数组为了保持内存数据的连续性，会致使插入、删除这两个操做比较低效。如今咱们就来详细说一下，究竟为何会致使低效？又有哪些改进方法呢？

咱们先来看插入操做。

假设数组的长度为 n，如今，若是咱们须要将一个数据插入到数组中的第 k 个位置。为了把第 k 个位置腾出来，给新来的数据，咱们须要将第 k～n 这部分的元素都顺序地日后挪一位。那插入操做的时间复杂度是多少呢？

若是在数组的末尾插入元素，那就不须要移动数据了，这时的时间复杂度为 O(1)。但若是在数组的开头插入元素，那全部的数据都须要依次日后移动一位，因此最坏时间复杂度是O(n)。由于咱们在每一个位置插入元素的几率是同样的，因此平均状况时间复杂度为 (1+2+…n)/n=O(n)。
可是，若是数组中存储的数据并无任何规律，数组只是被看成一个存储数据的集合。在这种状况下，若是要将某个数组插入到第 k个位置，为了不大规模的数据搬移，咱们还有一个简单的办法就是，直接将第 k 位的数据搬移到数组元素的最后，把新的元素直接放入第 k 个位置。

为了更好地理解，咱们举一个例子。假设数组 a[10] 中存储了以下 5 个元素：a，b，c，d，e。咱们如今须要将元素 x 插入到第 3 个位置。咱们只须要将 c 放入到 a[5]，将 a[2] 赋值为 x 便可。最后，数组中的元素以下： a，b，x，d，e，c。

咱们再来看删除操做。

跟插入数据相似，若是咱们要删除第 k 个位置的数据，为了内存的连续性，也须要搬移数据，否则中间就会出现空洞，内存就不连续了。

和插入相似，若是删除数组末尾的数据，则最好状况时间复杂度为 O(1)；若是删除开头的数据，则最坏状况时间复杂度为** O(n)**；平均状况时间复杂度也为 O(n)。

实际上，在某些特殊场景下，咱们并不必定非得追求数组中数据的连续性。若是咱们将屡次删除操做集中在一块儿执行，删除的效率是否是会提升不少呢？

咱们继续来看例子。数组 a[10] 中存储了 8 个元素：a，b，c，d，e，f，g，h。如今，咱们要依次删除 a，b，c 三个元素。为了不 d，e，f，g，h这几个数据会被搬移三次，咱们能够先记录下已经删除的数据。每次的删除操做并非真正地搬移数据，只是记录数据已经被删除。当数组没有更多空间存储数据时，咱们再触发执行一次真正的删除操做，这样就大大减小了删除操做致使的数据搬移。

容器可否彻底替代数组？

针对数组类型，不少语言都提供了容器类，好比 Java 中的 ArrayList。在项目开发中，何时适合用数组，何时适合用容器呢？

ArrayList 最大的优点就是能够将不少数组操做的细节封装起来。好比前面提到的数组插入、删除数据时须要搬移其余数据等。另外，它还有一个优点，就是支持动态扩容。

数组自己在定义的时候须要预先指定大小，由于须要分配连续的内存空间。若是咱们申请了大小为 10 的数组，当第 11 个数据须要存储到数组中时，咱们就须要从新分配一块更大的空间，将原来的数据复制过去，而后再将新的数据插入。

若是使用 ArrayList，咱们就彻底不须要关心底层的扩容逻辑，ArrayList 已经帮咱们实现好了。每次存储空间不够的时候，它都会将空间自动扩容为 1.5 倍大小。

那么何时用数组更合适呢

Java ArrayList 没法存储基本类型，好比 int、long，须要封装为 Integer、Long 类，而自动装拆箱则有必定的性能消耗，因此若是特别关注性能，或者但愿使用基本类型，就能够选用数组。
若是数据大小事先已知，而且对数据的操做很是简单，用不到 ArrayList 提供的大部分方法，也能够直接使用数组。
当要表示多维数组时，用数组每每会更加直观。好比 Object[][] array；而用容器的话则须要这样定义：ArrayList<ArrayList> array。