【译】Go 切片：用法和内部实现

时间 2019-12-07

标签切片用法内部实现繁體版

原文原文链接

原文标题：Go Slices: usage and internals

原文做者：Andrew Gerrand

原文时间：2011-01-05

Go 的切片（slice）提供了一种方便、高效的处理特定类型数据序列的方法。切片相似于其余语言中的数组，但有些特别的地方。本文讨论切片是什么、以及如何使用它。html

数组

Go 中切片是基于数组的，所以为了理解切片，首先得理解数组。
一个数组类型包括元素类型和元素个数。例如，类型 [4]int 表示有 4 个整数元素的数组。一个数组的长度是固定的，长度自己也是类型的一部分（[4]int 和 [5]int 是两个不一样的类型）。数组能经过下标访问，所以表达式 s[n] 表示访问下标从 0 开始的第 n 个元素。git

var a [4]int
a[0] = 1
i := a[0]
// i == 1
复制代码

数组不须要显示初始化，它会自动初始化为数组零值（the zero value of an array），这个零值中的全部的元素的值都是该元素类型的零值：golang

// a[2] == 0, 初始化为 int 类型的零值
复制代码

类型 [4]int 的内存表示就是 4 个整数顺序摆放：数组

Go 中数组是值类型。一个数组变量表示整个数组，而不是指向数组第一个元素的指针（C 语言是这样的）。这代表对一个数组进行赋值或传递，会复制整个数组内容。（你能够传递数组指针来避免内容复制，但这是一个数组指针，不是数组）一种理解数组的方法是把它当作一种 struct，经过下标来使用，而不是成员名，这是一种固定大小的复合值。
数组字面量（ literal）能这样写：

b := [2]string{"Penn", "Teller"}
复制代码

或者，让编译器计算元素的个数app

b := [...]string{"Penn", "Teller"}
复制代码

上面两种状况，变量 b 的类型都是 [2]string。函数

切片

数组用本身的用武之地，但不灵活，因此并不常常在 Go 代码中出现。与它对比，切片就经常使用的多。它基于数组，但很是方便和强大。
切片类型表示为 []T，其中 T 是切片中元素的类型。与数组类型不一样，切片类型不用指定长度。
一个切片的字面量和数组相似，除了不能指定元素个数：ui

letters := []string{"a", "b", "c", "d"}
复制代码

可使用内建函数 make 来建立切片，make 函数签名以下：spa

func make([]T, len, cap) []T 复制代码

其中 T 表示新切片中元素的类型。make 参数有：切片元素类型、切片长度、切片容量（可选）。调用 make 时，它会申请一个数组，而后返回一个使用该数组的切片。3d

var s []byte
s = make([]byte, 5, 5)
// s == []byte{0, 0, 0, 0}
复制代码

若是不指定切片容量，默认为与切片长度同样大小。下面是一个更简单的版本：指针

s := make([]byte, 5)
复制代码

使用内建函数 len 和 cap 来获取切片的长度和容量。

len(s) == 5
cap(s) == 5
复制代码

接下来两部分讨论切片长度和切片容量的关系。
切片的零值为 nil，这种状况下 len 和 cap 都返回 0。
对一个已有的数组或切片进行切片操做（译者：注意切片和切片操做的区别），能生成一个新的切片。切片操做经过两个下标中间加个冒号来指定一个半开的区间。好比，表达式 b[1:4] 建立了一个新切片，新切片包括 b 中下标为一、二、3 的元素（新切片中对应的下标为0、一、2）。

b := []byte{'g', 'o', 'l', 'a', 'n', 'g'}
// b[1:4] == []byte{'o', 'l', 'a'}, 与b共用同一内存空间
复制代码

表达式中开始和结束的下标都是可选的，默认分别为 0 和切片的长度。

// b[:2] == []byte{'g', 'o'}
// b[2:] == []byte{'l', 'a', 'n', 'g'}
// b[:] == b
复制代码

下面是经过数组来建立切片：

x := [3]string{"Лайка", "Белка", "Стрелка"}
s := x[:] // 切片 s 使用数组 x 的内存空间
复制代码

切片的内部实现

切片是数组某段的描述符，包括一个指向数组的指针，当前段的长度（length），还有容量（capacity）（这个段能到达的最大长度）。

上面使用 make([]byte, 5) 获得的变量 s ，它的结构以下：

其中的 长度表示当前切片中元素的个数。 容量表示底层数组的元素个数（该数组的起始地址为切片中的指针值）。下面的几个例子能帮你更佳清晰理解 长度和 容量的区别。
对上面变量 s 进行切片操做，观察它的结构变化，还有和底下数组的关系：

s = s[2:4]
复制代码

切片操做并不会复制原始切片或数组的数据，而是将新切片的数据指针指向原始数据。这使得切片操做能像操做数组索引同样高效。也所以，修改新切片的元素，原始切片也会被修改：

d := []byte{'r', 'o', 'a', 'd'}
e := d[2:]
// e == []byte{'a', 'd'}
e[1] = 'm'
// e == []byte{'a', 'm'}
// d == []byte{'r', 'o', 'a', 'm'}
复制代码

上面咱们对s进行了切片操做，使得s 的长度比其容量小。能再次经过切片操做增长 s 的长度，使得长度和容量相等。

s = s[:cap(s)]
复制代码

切片的长度不能超过其容量，若是尝试这么作会到形成一个运行时错误（runtime panic），就如同数组或切片下标越界同样。一样的，对切片进行切片操做时，参数不能小于0（想要访问底下数组以前的元素）。

切片增加（复制和添加元素）

想要增长切片的容量，只能建立一个新的，容量更大的切片，而后把原始数据复制过去。其余语言的动态数组的实现也是使用的这种幕后技术。下面代码的操做：建立一个容量为 s 的两倍的新切片 t，复制 s 的内容到 t，最后将 t 赋值给 s。

t := make([]byte, len(s), (cap(s)+1)*2) // +1 防止 cap(s) == 0 的状况
for i := range s {
  t[i] = s[i]
}
s = t
复制代码

内建函数 copy 实现了上面代码中循环的功能。它将要复制的内容从原始切片拷贝到目的切片，返回拷贝元素的个数。

func copy(dst, src []T) int 复制代码

copy 支持不一样长度的切片间的拷贝（拷贝长度为两切片中长度小的那个）。并且，它还能正确处理源切片和目的切片处于同一个数组上的状况。
使用 copy 上面的代码简化为：

t = make([]byte, len(s), (cap(s)+1)*2)
copy(t, s)
s = t
复制代码

将数据添加到切片的末尾是很经常使用的操做。下面这个函数会将一个 byte 元素添加到元素类型为 byte 的切片中。若是有必要，它会增长切片的大小。最后返回添加后的切片。

func AppendByte(slice []byte, data ...byte) []byte {
  m := len(slice)
  n := m + len(data)
  if n > cap(slice) { //从新申请空间
    // 申请两倍的空间，以备后用
    newSlice := make([]byte, (n+1)*2)
    copy(newSlice, slice)
    slice = newSlice
  }
  slice = slice[0:n]
  copy(slice[m:n], data)
  return slice
}
复制代码

AppendByte 函数用法以下：

p := []byte{2, 3, 5}
 p = AppendByte(p, 7, 11, 13)
 // p == []byte{2, 3, 5, 7, 11, 13}
复制代码

相似于 AppendByte 的函数是颇有用的，由于它提供了彻底掌控切片增加的方式。根据不一样程序的不一样特性，能调整分配更大或更小的空间，或者设置一个分配空间上限。
但大部分程序不须要这样的彻底掌控，因此 Go 提供了一个内建函数实现这个功能。太部分状况下都很好用，函数签名以下：

func append(s []T, X ...T) []T 复制代码

apppend 将元素 x 添加到切片 s 的末尾，若有必要，它会增长切片的容量。

a := make([]int, 1)
// a == []int{0}
a = append(a, 1, 2, 3)
// a == []int{0, 1, 2, 3}
复制代码

将一个切片添加到另外一个切片，使用操做符 ... 将第二切片展开成参数列表。

a := []string{"John", "Paul"}
b := []string{"George", "Ringo", "pete"}
a = append(a, b...) // 等同于 ”append(a, b[0], b[1], b[2])"
// a == []string{"John", "Paul", "George", "Ringo", "Pete"}
复制代码

由于切片的零值（nil）有相似于长度为零的切片的属性，所以能够直接声明一个变量，向其添加元素：

// Filter 函数返回一个包含知足 fn() 的元素的新切片
func Filter(s []int, fn func(int) bool) []int {
  var p []int // == nil
  for _, v := range s {
    if fn(v) {
      p = append(p, v)
    }
  }
  return p
}
复制代码

一个可能的陷阱（A possible "gotcha"）

前面提到，对切片进行切片操做不会复制切片结构里面的数组数据。整个数组会一直占用内存空间，直到引用数为零。有些状况下，这会形成一个问题：程序只须要用到一块数据中一小段，却得把整个数据块保留在内存中。
例如，下面的函数加载一个文件进内存，查找第一组连续数字的序列做为新的切片返回。

var digitRegexp = regexp.MustCompile("[0-9]+")
func FindDigits(filename string) []byte {
  b, _ := ioutil.ReadFile(filename)
  return digitRegexp.Find(b)
}
复制代码

这段代码能够正确运行，可是有个问题：返回的切片使用了包含整个文件的数组。由于返回的切片引用了原始数组，只要切片还在，原始数组就不能被垃圾回收 -- 对文件某一小段的使用使得整个文件都必须占用内存。
为了解决这个问题，能够在返回以前将目标数据复制到一个新切片中：

func CopyDigits(filename string) []byte {
  b, _ := ioutil.ReadFile(filename)
  b = digitRegexp.Find(b)
  c := make([]byte, len(b))
  copy(c, b)
  return c
}
复制代码

这个函数另一个更简洁的版本是使用 append，这是做为一个练习，留个读者完成。

译者总结

只用切片不用数组 : )

【译】Go 切片：用法和内部实现

数组

切片

切片的内部实现

切片增加（复制和添加元素）

一个可能的陷阱（A possible "gotcha"）

更多资料

译者总结