Go的50度灰:Golang新开发者要注意的陷阱和常见错误(转)

目录 [−]

  1. 初级
    1. 开大括号不能放在单独的一行
    2. 未使用的变量
    3. 未使用的Imports
    4. 简式的变量声明仅能够在函数内部使用
    5. 使用简式声明重复声明变量
    6. 偶然的变量隐藏Accidental Variable Shadowing
    7. 不使用显式类型,没法使用“nil”来初始化变量
    8. 使用“nil” Slices and Maps
    9. Map的容量
    10. 字符串不会为nil
    11. Array函数的参数
    12. 在Slice和Array使用“range”语句时的出现的不但愿获得的值
    13. Slices和Arrays是一维的
    14. 访问不存在的Map Keys
    15. Strings没法修改
    16. String和Byte Slice之间的转换
    17. String和索引操做
    18. 字符串不老是UTF8文本
    19. 字符串的长度
    20. 在多行的Slice、Array和Map语句中遗漏逗号
    21. log.Fatal和log.Panic不只仅是Log
    22. 内建的数据结构操做不是同步的
    23. String在“range”语句中的迭代值
    24. 对Map使用“for range”语句迭代
    25. "switch"声明中的失效行为
    26. 自增和自减
    27. 按位NOT操做
    28. 操做优先级的差别
    29. 未导出的结构体不会被编码
    30. 有活动的Goroutines下的应用退出
    31. 向无缓存的Channel发送消息,只要目标接收者准备好就会当即返回
    32. 向已关闭的Channel发送会引发Panic
    33. 使用"nil" Channels
    34. 传值方法的接收者没法修改原有的值
  2. 中级
    1. 关闭HTTP的响应
    2. 关闭HTTP的链接
    3. 比较Structs, Arrays, Slices, and Maps
    4. 从Panic中恢复
    5. 在Slice, Array, and Map "range"语句中更新引用元素的值
    6. 在Slice中"隐藏"数据
    7. Slice的数据“毁坏”
    8. 陈旧的(Stale)Slices
    9. 类型声明和方法
    10. 从"for switch"和"for select"代码块中跳出
    11. "for"声明中的迭代变量和闭包
    12. Defer函数调用参数的求值
    13. 被Defer的函数调用执行
    14. 失败的类型断言
    15. 阻塞的Goroutine和资源泄露
  3. 高级
    1. 使用指针接收方法的值的实例
    2. 更新Map的值
    3. "nil" Interfaces和"nil" Interfaces的值
    4. 栈和堆变量
    5. GOMAXPROCS, 并发, 和并行
    6. 读写操做的重排顺序
    7. 优先调度

原文: 50 Shades of Go: Traps, Gotchas, and Common Mistakes for New Golang Devs
翻译: Go的50度灰:新Golang开发者要注意的陷阱、技巧和常见错误, 译者: 影风LEYphp

Go是一门简单有趣的语言,但与其余语言相似,它会有一些技巧。。。这些技巧的绝大部分并非Go的缺陷形成的。若是你之前使用的是其余语言,那么这其中的有些错误就是很天然的陷阱。其它的是由错误的假设和缺乏细节形成的。golang

若是你花时间学习这门语言,阅读官方说明、wiki、邮件列表讨论、大量的优秀博文和Rob Pike的展现,以及源代码,这些技巧中的绝大多数都是显而易见的。尽管不是每一个人都是以这种方式开始学习的,但也不要紧。若是你是Go语言新人,那么这里的信息将会节约你大量的调试代码的时间。
express

初级

开大括号不能放在单独的一行

在大多数其余使用大括号的语言中,你须要选择放置它们的位置。Go的方式不一样。你能够为此感谢下自动分号的注入(没有预读)。是的,Go中也是有分号的:-)
失败的例子:json

1
2
3
4
5
6
7
8
package main
 
import "fmt"
 
func main()
{ //error, can't have the opening brace on a separate line
fmt.Println( "hello there!")
}

编译错误:api

/tmp/sandbox826898458/main.go:6: syntax error: unexpected semicolon or newline before {数组

有效的例子:缓存

1
2
3
4
5
6
7
package main
 
import "fmt"
 
func main() {
fmt.Println( "works!")
}

未使用的变量

若是你有未使用的变量,代码将编译失败。固然也有例外。在函数内必定要使用声明的变量,但未使用的全局变量是没问题的。
若是你给未使用的变量分配了一个新的值,代码仍是会编译失败。你须要在某个地方使用这个变量,才能让编译器愉快的编译。
Fails:安全

1
2
3
4
5
6
7
8
9
10
package main
 
var gvar int //not an error
 
func main() {
var one int //error, unused variable
two := 2 //error, unused variable
var three int //error, even though it's assigned 3 on the next line
three = 3
}

Compile Errors:服务器

/tmp/sandbox473116179/main.go:6: one declared and not used
/tmp/sandbox473116179/main.go:7: two declared and not used
/tmp/sandbox473116179/main.go:8: three declared and not used网络

Works:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
package main
 
import "fmt"
 
func main() {
var one int
_ = one
 
two := 2
fmt.Println(two)
 
var three int
three = 3
one = three
 
var four int
four = four
}

另外一个选择是注释掉或者移除未使用的变量 :-)

未使用的Imports

若是你引入一个包,而没有使用其中的任何函数、接口、结构体或者变量的话,代码将会编译失败。
你可使用goimports来增长引入或者移除未使用的引用:

1
$ go get golang.org/x/tools/cmd/goimports

若是你真的须要引入的包,你能够添加一个下划线标记符,_,来做为这个包的名字,从而避免编译失败。下滑线标记符用于引入,但不使用。

Fails:

1
2
3
4
5
6
7
8
9
10
package main
 
import (
"fmt"
"log"
"time"
)
 
func main() {
}

Compile Errors:

/tmp/sandbox627475386/main.go:4: imported and not used: "fmt"
/tmp/sandbox627475386/main.go:5: imported and not used: "log"
/tmp/sandbox627475386/main.go:6: imported and not used: "time"

Works:

1
2
3
4
5
6
7
8
9
10
11
12
13
package main
 
import (
_ "fmt"
"log"
"time"
)
 
var _ = log.Println
 
func main() {
_ = time.Now
}

另外一个选择是移除或者注释掉未使用的imports :-)

简式的变量声明仅能够在函数内部使用

Fails:

1
2
3
4
5
6
package main
 
myvar := 1 //error
 
func main() {
}

Compile Error:

/tmp/sandbox265716165/main.go:3: non-declaration statement outside function body

Works:

1
2
3
4
5
6
package main
 
var myvar = 1
 
func main() {
}

使用简式声明重复声明变量

你不能在一个单独的声明中重复声明一个变量,但在多变量声明中这是容许的,其中至少要有一个新的声明变量。
重复变量须要在相同的代码块内,不然你将获得一个隐藏变量。
Fails:

1
2
3
4
5
6
package main
 
func main() {
one := 0
one := 1 //error
}

Compile Error:

/tmp/sandbox706333626/main.go:5: no new variables on left side of :=

Works:

1
2
3
4
5
6
7
8
package main
 
func main() {
one := 0
one, two := 1,2
 
one,two = two,one
}

偶然的变量隐藏Accidental Variable Shadowing

短式变量声明的语法如此的方便(尤为对于那些使用过动态语言的开发者而言),很容易让人把它当成一个正常的分配操做。若是你在一个新的代码块中犯了这个错误,将不会出现编译错误,但你的应用将不会作你所指望的事情。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
package main
 
import "fmt"
 
func main() {
x := 1
fmt.Println(x) //prints 1
{
fmt.Println(x) //prints 1
x := 2
fmt.Println(x) //prints 2
}
fmt.Println(x) //prints 1 (bad if you need 2)
}

即便对于经验丰富的Go开发者而言,这也是一个很是常见的陷阱。这个坑很容易挖,但又很难发现。

你可使用 vet命令来发现一些这样的问题。 默认状况下, vet不会执行这样的检查,你须要设置-shadow参数:
go tool vet -shadow your_file.go

不使用显式类型,没法使用“nil”来初始化变量

nil标志符用于表示interface、函数、maps、slices和channels的“零值”。若是你不指定变量的类型,编译器将没法编译你的代码,由于它猜不出具体的类型。
Fails:

1
2
3
4
5
6
7
package main
 
func main() {
var x = nil //error
 
_ = x
}

Compile Error:

/tmp/sandbox188239583/main.go:4: use of untyped nil

Works:

1
2
3
4
5
6
7
package main
 
func main() {
var x interface{} = nil
 
_ = x
}

使用“nil” Slices and Maps

在一个nil的slice中添加元素是没问题的,但对一个map作一样的事将会生成一个运行时的panic。

Works:

1
2
3
4
5
6
package main
 
func main() {
var s []int
s = append(s,1)
}

Fails:

1
2
3
4
5
6
7
package main
 
func main() {
var m map[string]int
m[ "one"] = 1 //error
 
}

Map的容量

你能够在map建立时指定它的容量,但你没法在map上使用cap()函数。

Fails:

1
2
3
4
5
6
package main
 
func main() {
m := make(map[string]int,99)
cap(m) //error
}

Compile Error:

/tmp/sandbox326543983/main.go:5: invalid argument m (type map[string]int) for cap

字符串不会为nil

这对于常用nil分配字符串变量的开发者而言是个须要注意的地方。

Fails:

1
2
3
4
5
6
7
8
9
package main
 
func main() {
var x string = nil //error
 
if x == nil { //error
x = "default"
}
}

Compile Errors:

/tmp/sandbox630560459/main.go:4: cannot use nil as type string in assignment /tmp/sandbox630560459/main.go:6: invalid operation: x == nil (mismatched types string and nil)

Works:

1
2
3
4
5
6
7
8
9
package main
 
func main() {
var x string //defaults to "" (zero value)
 
if x == "" {
x = "default"
}
}

Array函数的参数

若是你是一个C或则C++开发者,那么数组对你而言就是指针。当你向函数中传递数组时,函数会参照相同的内存区域,这样它们就能够修改原始的数据。Go中的数组是数值,所以当你向函数中传递数组时,函数会获得原始数组数据的一份复制。若是你打算更新数组的数据,这将会是个问题。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
package main
 
import "fmt"
 
func main() {
x := [3]int{1,2,3}
 
func(arr [3]int) {
arr [0] = 7
fmt.Println(arr) //prints [7 2 3]
}(x)
 
fmt.Println(x) //prints [1 2 3] (not ok if you need [7 2 3])
}

若是你须要更新原始数组的数据,你可使用数组指针类型。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
package main
 
import "fmt"
 
func main() {
x := [3]int{1,2,3}
 
func(arr *[3]int) {
(*arr) [0] = 7
fmt.Println(arr) //prints &[7 2 3]
}(&x)
 
fmt.Println(x) //prints [7 2 3]
}

另外一个选择是使用slice。即便你的函数获得了slice变量的一份拷贝,它依旧会参照原始的数据。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
package main
 
import "fmt"
 
func main() {
x := [] int{1,2,3}
 
func(arr []int) {
arr [0] = 7
fmt.Println(arr) //prints [7 2 3]
}(x)
 
fmt.Println(x) //prints [7 2 3]
}

在Slice和Array使用“range”语句时的出现的不但愿获得的值

若是你在其余的语言中使用“for-in”或者“foreach”语句时会发生这种状况。Go中的“range”语法不太同样。它会获得两个值:第一个值是元素的索引,而另外一个值是元素的数据。
Bad:

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "fmt"
 
func main() {
x := [] string{"a","b","c"}
 
for v := range x {
fmt.Println(v) //prints 0, 1, 2
}
}

Good:

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "fmt"
 
func main() {
x := [] string{"a","b","c"}
 
for _, v := range x {
fmt.Println(v) //prints a, b, c
}
}

Slices和Arrays是一维的

看起来Go好像支持多维的Array和Slice,但不是这样的。尽管能够建立数组的数组或者切片的切片。对于依赖于动态多维数组的数值计算应用而言,Go在性能和复杂度上还相距甚远。

你可使用纯一维数组、“独立”切片的切片,“共享数据”切片的切片来构建动态的多维数组。

若是你使用纯一维的数组,你须要处理索引、边界检查、当数组须要变大时的内存从新分配。

使用“独立”slice来建立一个动态的多维数组须要两步。首先,你须要建立一个外部的slice。而后,你须要分配每一个内部的slice。内部的slice相互之间独立。你能够增长减小它们,而不会影响其余内部的slice。

1
2
3
4
5
6
7
8
9
10
11
package main
 
func main() {
x := 2
y := 4
 
table := make([][]int,x)
for i:= range table {
table[i] = make([]int,y)
}
}

使用“共享数据”slice的slice来建立一个动态的多维数组须要三步。首先,你须要建立一个用于存放原始数据的数据“容器”。而后,你再建立外部的slice。最后,经过从新切片原始数据slice来初始化各个内部的slice。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
package main
 
import "fmt"
 
func main() {
h, w := 2, 4
 
raw := make([]int,h*w)
for i := range raw {
raw[i] = i
}
fmt.Println(raw,&raw [4])
//prints: [0 1 2 3 4 5 6 7] <ptr_addr_x>
 
table := make([][]int,h)
for i:= range table {
table[i] = raw[i*w:i*w + w]
}
 
fmt.Println(table,&table [1][0])
//prints: [[0 1 2 3] [4 5 6 7]] <ptr_addr_x>
}

关于多维array和slice已经有了专门申请,但如今看起来这是个低优先级的特性。

访问不存在的Map Keys

这对于那些但愿获得“nil”标示符的开发者而言是个技巧(和其余语言中作的同样)。若是对应的数据类型的“零值”是“nil”,那返回的值将会是“nil”,但对于其余的数据类型是不同的。检测对应的“零值”能够用于肯定map中的记录是否存在,但这并不老是可信(好比,若是在二值的map中“零值”是false,这时你要怎么作)。检测给定map中的记录是否存在的最可信的方法是,经过map的访问操做,检查第二个返回的值。

Bad:

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "fmt"
 
func main() {
x := map[string]string{"one":"a","two":"","three":"c"}
 
if v := x["two"]; v == "" { //incorrect
fmt.Println( "no entry")
}
}

Good:

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "fmt"
 
func main() {
x := map[string]string{"one":"a","two":"","three":"c"}
 
if _,ok := x["two"]; !ok {
fmt.Println( "no entry")
}
}

Strings没法修改

尝试使用索引操做来更新字符串变量中的单个字符将会失败。string是只读的byte slice(和一些额外的属性)。若是你确实须要更新一个字符串,那么使用byte slice,并在须要时把它转换为string类型。

Fails:

1
2
3
4
5
6
7
8
9
10
package main
 
import "fmt"
 
func main() {
x := "text"
x [0] = 'T'
 
fmt.Println(x)
}

Compile Error:

/tmp/sandbox305565531/main.go:7: cannot assign to x[0]

Works:

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "fmt"
 
func main() {
x := "text"
xbytes := [] byte(x)
xbytes [0] = 'T'
 
fmt.Println( string(xbytes)) //prints Text
}

须要注意的是:这并非在文字string中更新字符的正确方式,由于给定的字符可能会存储在多个byte中。若是你确实须要更新一个文字string,先把它转换为一个rune slice。即便使用rune slice,单个字符也可能会占据多个rune,好比当你的字符有特定的重音符号时就是这种状况。这种复杂又模糊的“字符”本质是Go字符串使用byte序列表示的缘由。

String和Byte Slice之间的转换

当你把一个字符串转换为一个byte slice(或者反之)时,你就获得了一个原始数据的完整拷贝。这和其余语言中cast操做不一样,也和新的slice变量指向原始byte slice使用的相同数组时的从新slice操做不一样。

Go在[]bytestringstring[]byte的转换中确实使用了一些优化来避免额外的分配(在todo列表中有更多的优化)。

第一个优化避免了当[]byte keys用于在map[string]集合中查询时的额外分配:m[string(key)]

第二个优化避免了字符串转换为[]byte后在for range语句中的额外分配:for i,v := range []byte(str) {...}

String和索引操做

字符串上的索引操做返回一个byte值,而不是一个字符(和其余语言中的作法同样)。

1
2
3
4
5
6
7
8
9
package main
 
import "fmt"
 
func main() {
x := "text"
fmt.Println(x [0]) //print 116
fmt.Printf( "%T",x[0]) //prints uint8
}

若是你须要访问特定的字符串“字符”(unicode编码的points/runes),使用for range。官方的“unicode/utf8”包和实验中的utf8string包(golang.org/x/exp/utf8string)也能够用。utf8string包中包含了一个很方便的At()方法。把字符串转换为rune的切片也是一个选项。

字符串不老是UTF8文本

字符串的值不须要是UTF8的文本。它们能够包含任意的字节。只有在string literal使用时,字符串才会是UTF8。即便以后它们可使用转义序列来包含其余的数据。

为了知道字符串是不是UTF8,你可使用“unicode/utf8”包中的ValidString()函数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
package main
 
import (
"fmt"
"unicode/utf8"
)
 
func main() {
data1 := "ABC"
fmt.Println(utf8.ValidString(data1)) //prints: true
 
data2 := "A\xfeC"
fmt.Println(utf8.ValidString(data2)) //prints: false
}

字符串的长度

让咱们假设你是Python开发者,你有下面这段代码:

1
2
data = u'♥'
print(len(data)) #prints: 1

当把它转换为Go代码时,你可能会大吃一惊。

1
2
3
4
5
6
7
8
package main
 
import "fmt"
 
func main() {
data := "♥"
fmt.Println( len(data)) //prints: 3
}

内建的len()函数返回byte的数量,而不是像Python中计算好的unicode字符串中字符的数量。

要在Go中获得相同的结果,可使用“unicode/utf8”包中的RuneCountInString()函数。

1
2
3
4
5
6
7
8
9
10
11
package main
 
import (
"fmt"
"unicode/utf8"
)
 
func main() {
data := "♥"
fmt.Println(utf8.RuneCountInString(data)) //prints: 1
}

理论上说RuneCountInString()函数并不返回字符的数量,由于单个字符可能占用多个rune。

1
2
3
4
5
6
7
8
9
10
11
12
package main
 
import (
"fmt"
"unicode/utf8"
)
 
func main() {
data := "é"
fmt.Println( len(data)) //prints: 3
fmt.Println(utf8.RuneCountInString(data)) //prints: 2
}

在多行的Slice、Array和Map语句中遗漏逗号

Fails:

1
2
3
4
5
6
7
8
9
package main
 
func main() {
x := [] int{
1,
2 //error
}
_ = x
}

Compile Errors:

/tmp/sandbox367520156/main.go:6: syntax error: need trailing comma before newline in composite literal /tmp/sandbox367520156/main.go:8: non-declaration statement outside function body /tmp/sandbox367520156/main.go:9: syntax error: unexpected }

Works:

1
2
3
4
5
6
7
8
9
10
11
12
package main
 
func main() {
x := [] int{
1,
2,
}
x = x
 
y := [] int{3,4,} //no error
y = y
}

当你把声明折叠到单行时,若是你没加末尾的逗号,你将不会获得编译错误。

log.Fatal和log.Panic不只仅是Log

Logging库通常提供不一样的log等级。与这些logging库不一样,Go中log包在你调用它的Fatal*()Panic*()函数时,能够作的不只仅是log。当你的应用调用这些函数时,Go也将会终止应用 :-)

1
2
3
4
5
6
7
8
package main
 
import "log"
 
func main() {
log.Fatalln( "Fatal Level: log entry") //app exits here
log.Println( "Normal Level: log entry")
}

内建的数据结构操做不是同步的

即便Go自己有不少特性来支持并发,并发安全的数据集合并非其中之一 :-)确保数据集合以原子的方式更新是你的职责。Goroutines和channels是实现这些原子操做的推荐方式,但你也可使用“sync”包,若是它对你的应用有意义的话。

String在“range”语句中的迭代值

索引值(“range”操做返回的第一个值)是返回的第二个值的当前“字符”(unicode编码的point/rune)的第一个byte的索引。它不是当前“字符”的索引,这与其余语言不一样。注意真实的字符可能会由多个rune表示。若是你须要处理字符,确保你使用了“norm”包(golang.org/x/text/unicode/norm)。

string变量的for range语句将会尝试把数据翻译为UTF8文本。对于它没法理解的任何byte序列,它将返回0xfffd runes(即unicode替换字符),而不是真实的数据。若是你任意(非UTF8文本)的数据保存在string变量中,确保把它们转换为byte slice,以获得全部保存的数据。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
package main
 
import "fmt"
 
func main() {
data := "A\xfe\x02\xff\x04"
for _,v := range data {
fmt.Printf( "%#x ",v)
}
//prints: 0x41 0xfffd 0x2 0xfffd 0x4 (not ok)
 
fmt.Println()
for _,v := range []byte(data) {
fmt.Printf( "%#x ",v)
}
//prints: 0x41 0xfe 0x2 0xff 0x4 (good)
}

对Map使用“for range”语句迭代

若是你但愿以某个顺序(好比,按key值排序)的方式获得元素,就须要这个技巧。每次的map迭代将会生成不一样的结果。Go的runtime有心尝试随机化迭代顺序,但并不总会成功,这样你可能获得一些相同的map迭代结果。因此若是连续看到5个相同的迭代结果,不要惊讶。

1
2
3
4
5
6
7
8
9
10
package main
 
import "fmt"
 
func main() {
m := map[string]int{"one":1,"two":2,"three":3,"four":4}
for k,v := range m {
fmt.Println(k,v)
}
}

并且若是你使用Go的游乐场(https://play.golang.org/),你将总会获得一样的结果,由于除非你修改代码,不然它不会从新编译代码。

"switch"声明中的失效行为

在“switch”声明语句中的“case”语句块在默认状况下会break。这和其余语言中的进入下一个“next”代码块的默认行为不一样。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
package main
 
import "fmt"
 
func main() {
isSpace := func(ch byte) bool {
switch(ch) {
case ' ': //error
case '\t':
return true
}
return false
}
 
fmt.Println(isSpace( '\t')) //prints true (ok)
fmt.Println(isSpace( ' ')) //prints false (not ok)
}

你能够经过在每一个“case”块的结尾使用“fallthrough”,来强制“case”代码块进入。你也能够重写switch语句,来使用“case”块中的表达式列表。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
package main
 
import "fmt"
 
func main() {
isSpace := func(ch byte) bool {
switch(ch) {
case ' ', '\t':
return true
}
return false
}
 
fmt.Println(isSpace( '\t')) //prints true (ok)
fmt.Println(isSpace( ' ')) //prints true (ok)
}

自增和自减

许多语言都有自增和自减操做。不像其余语言,Go不支持前置版本的操做。你也没法在表达式中使用这两个操做符。
Fails:

1
2
3
4
5
6
7
8
9
10
package main
 
import "fmt"
 
func main() {
data := [] int{1,2,3}
i := 0
++i //error
fmt.Println(data[i++]) //error
}

Compile Errors:

/tmp/sandbox101231828/main.go:8: syntax error: unexpected ++ /tmp/sandbox101231828/main.go:9: syntax error: unexpected ++, expecting :

Works:

1
2
3
4
5
6
7
8
9
10
package main
 
import "fmt"
 
func main() {
data := [] int{1,2,3}
i := 0
i++
fmt.Println(data[i])
}

按位NOT操做

许多语言使用 ~做为一元的NOT操做符(即按位补足),但Go为了这个重用了XOR操做符(^)。

Fails:

1
2
3
4
5
6
7
package main
 
import "fmt"
 
func main() {
fmt.Println( ~2) //error
}

Compile Error:

/tmp/sandbox965529189/main.go:6: the bitwise complement operator is ^

Works:

1
2
3
4
5
6
7
8
package main
 
import "fmt"
 
func main() {
var d uint8 = 2
fmt.Printf( "%08b\n",^d)
}

Go依旧使用^做为XOR的操做符,这可能会让一些人迷惑。

若是你愿意,你可使用一个二元的XOR操做(如, 0x02 XOR 0xff)来表示一个一元的NOT操做(如,NOT 0x02)。这能够解释为何^被重用来表示一元的NOT操做。

Go也有特殊的‘AND NOT’按位操做(&^),这也让NOT操做更加的让人迷惑。这看起来须要特殊的特性/hack来支持 A AND (NOT B),而无需括号。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
package main
 
import "fmt"
 
func main() {
var a uint8 = 0x82
var b uint8 = 0x02
fmt.Printf( "%08b [A]\n",a)
fmt.Printf( "%08b [B]\n",b)
 
fmt.Printf( "%08b (NOT B)\n",^b)
fmt.Printf( "%08b ^ %08b = %08b [B XOR 0xff]\n",b,0xff,b ^ 0xff)
 
fmt.Printf( "%08b ^ %08b = %08b [A XOR B]\n",a,b,a ^ b)
fmt.Printf( "%08b & %08b = %08b [A AND B]\n",a,b,a & b)
fmt.Printf( "%08b &^%08b = %08b [A 'AND NOT' B]\n",a,b,a &^ b)
fmt.Printf( "%08b&(^%08b)= %08b [A AND (NOT B)]\n",a,b,a & (^b))
}

操做优先级的差别

除了”bit clear“操做(&^),Go也一个与许多其余语言共享的标准操做符的集合。尽管操做优先级并不老是同样。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
package main
 
import "fmt"
 
func main() {
fmt.Printf( "0x2 & 0x2 + 0x4 -> %#x\n",0x2 & 0x2 + 0x4)
//prints: 0x2 & 0x2 + 0x4 -> 0x6
//Go: (0x2 & 0x2) + 0x4
//C++: 0x2 & (0x2 + 0x4) -> 0x2
 
fmt.Printf( "0x2 + 0x2 << 0x1 -> %#x\n",0x2 + 0x2 << 0x1)
//prints: 0x2 + 0x2 << 0x1 -> 0x6
//Go: 0x2 + (0x2 << 0x1)
//C++: (0x2 + 0x2) << 0x1 -> 0x8
 
fmt.Printf( "0xf | 0x2 ^ 0x2 -> %#x\n",0xf | 0x2 ^ 0x2)
//prints: 0xf | 0x2 ^ 0x2 -> 0xd
//Go: (0xf | 0x2) ^ 0x2
//C++: 0xf | (0x2 ^ 0x2) -> 0xf
}

未导出的结构体不会被编码

以小写字母开头的结构体将不会被(json、xml、gob等)编码,所以当你编码这些未导出的结构体时,你将会获得零值。

Fails:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
package main
 
import (
"fmt"
"encoding/json"
)
 
type MyData struct {
One int
two string
}
 
func main() {
in := MyData {1,"two"}
fmt.Printf( "%#v\n",in) //prints main.MyData{One:1, two:"two"}
 
encoded,_ := json.Marshal(in)
fmt.Println( string(encoded)) //prints {"One":1}
 
 
var out MyData
json.Unmarshal(encoded,&out)
 
fmt.Printf( "%#v\n",out) //prints main.MyData{One:1, two:""}
}

有活动的Goroutines下的应用退出

应用将不会等待全部的goroutines完成。这对于初学者而言是个很常见的错误。每一个人都是以某个程度开始,所以若是犯了初学者的错误也没神马好丢脸的 :-)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
package main
 
import (
"fmt"
"time"
)
 
func main() {
workerCount := 2
 
for i := 0; i < workerCount; i++ {
go doit(i)
}
time.Sleep (1 * time.Second)
fmt.Println( "all done!")
}
 
func doit(workerId int) {
fmt.Printf( "[%v] is running\n",workerId)
time.Sleep (3 * time.Second)
fmt.Printf( "[%v] is done\n",workerId)
}

你将会看到:

1
2
3
[ 0] is running
[ 1] is running
all done!

一个最多见的解决方法是使用“WaitGroup”变量。它将会让主goroutine等待全部的worker goroutine完成。若是你的应用有长时运行的消息处理循环的worker,你也将须要一个方法向这些goroutine发送信号,让它们退出。你能够给各个worker发送一个“kill”消息。另外一个选项是关闭一个全部worker都接收的channel。这是一次向全部goroutine发送信号的简单方式。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
package main
 
import (
"fmt"
"sync"
)
 
func main() {
var wg sync.WaitGroup
done := make(chan struct{})
workerCount := 2
 
for i := 0; i < workerCount; i++ {
wg.Add (1)
go doit(i,done,wg)
}
 
close(done)
wg.Wait()
fmt.Println( "all done!")
}
 
func doit(workerId int,done <-chan struct{},wg sync.WaitGroup) {
fmt.Printf( "[%v] is running\n",workerId)
defer wg.Done()
<- done
fmt.Printf( "[%v] is done\n",workerId)
}

若是你运行这个应用,你将会看到:

1
2
3
4
[ 0] is running
[ 0] is done
[ 1] is running
[ 1] is done

看起来全部的worker在主goroutine退出前都完成了。棒!然而,你也将会看到这个:

1
fatal error: all goroutines are asleep - deadlock!

这可不太好 :-) 发送了神马?为何会出现死锁?worker退出了,它们也执行了wg.Done()。应用应该没问题啊。

死锁发生是由于各个worker都获得了原始的“WaitGroup”变量的一个拷贝。当worker执行wg.Done()时,并无在主goroutine上的“WaitGroup”变量上生效。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
package main
 
import (
"fmt"
"sync"
)
 
func main() {
var wg sync.WaitGroup
done := make(chan struct{})
wq := make(chan interface{})
workerCount := 2
 
for i := 0; i < workerCount; i++ {
wg.Add (1)
go doit(i,wq,done,&wg)
}
 
for i := 0; i < workerCount; i++ {
wq <- i
}
 
close(done)
wg.Wait()
fmt.Println( "all done!")
}
 
func doit(workerId int, wq <-chan interface{},done <-chan struct{},wg *sync.WaitGroup) {
fmt.Printf( "[%v] is running\n",workerId)
defer wg.Done()
for {
select {
case m := <- wq:
fmt.Printf( "[%v] m => %v\n",workerId,m)
case <- done:
fmt.Printf( "[%v] is done\n",workerId)
return
}
}
}

如今它会如预期般工做 :-)

向无缓存的Channel发送消息,只要目标接收者准备好就会当即返回

发送者将不会被阻塞,除非消息正在被接收者处理。根据你运行代码的机器的不一样,接收者的goroutine可能会或者不会有足够的时间,在发送者继续执行前处理消息。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
package main
 
import "fmt"
 
func main() {
ch := make(chan string)
 
go func() {
for m := range ch {
fmt.Println( "processed:",m)
}
}()
 
ch <- "cmd.1"
ch <- "cmd.2" //won't be processed
}

向已关闭的Channel发送会引发Panic

从一个关闭的channel接收是安全的。在接收状态下的ok的返回值将被设置为false,这意味着没有数据被接收。若是你从一个有缓存的channel接收,你将会首先获得缓存的数据,一旦它为空,返回的ok值将变为false

向关闭的channel中发送数据会引发panic。这个行为有文档说明,但对于新的Go开发者的直觉不一样,他们可能但愿发送行为与接收行为很像。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
package main
 
import (
"fmt"
"time"
)
 
func main() {
ch := make(chan int)
for i := 0; i < 3; i++ {
go func(idx int) {
ch <- (idx + 1) * 2
}(i)
}
 
//get the first result
fmt.Println(<-ch)
close(ch) //not ok (you still have other senders)
//do other work
time.Sleep (2 * time.Second)
}

根据不一样的应用,修复方法也将不一样。多是很小的代码修改,也可能须要修改应用的设计。不管是哪一种方法,你都须要确保你的应用不会向关闭的channel中发送数据。

上面那个有bug的例子能够经过使用一个特殊的废弃的channel来向剩余的worker发送再也不须要它们的结果的信号来修复。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
package main
 
import (
"fmt"
"time"
)
 
func main() {
ch := make(chan int)
done := make(chan struct{})
for i := 0; i < 3; i++ {
go func(idx int) {
select {
case ch <- (idx + 1) * 2: fmt.Println(idx,"sent result")
case <- done: fmt.Println(idx,"exiting")
}
}(i)
}
 
//get first result
fmt.Println( "result:",<-ch)
close(done)
//do other work
time.Sleep (3 * time.Second)
}

使用"nil" Channels

在一个nil的channel上发送和接收操做会被永久阻塞。这个行为有详细的文档解释,但它对于新的Go开发者而言是个惊喜。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
package main
 
import (
"fmt"
"time"
)
 
func main() {
var ch chan int
for i := 0; i < 3; i++ {
go func(idx int) {
ch <- (idx + 1) * 2
}(i)
}
 
//get first result
fmt.Println( "result:",<-ch)
//do other work
time.Sleep (2 * time.Second)
}

若是运行代码你将会看到一个runtime错误:

1
fatal error: all goroutines are asleep - deadlock!

这个行为能够在select声明中用于动态开启和关闭case代码块的方法。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
package main
 
import "fmt"
import "time"
 
func main() {
inch := make(chan int)
outch := make(chan int)
 
go func() {
var in <- chan int = inch
var out chan <- int
var val int
for {
select {
case out <- val:
out = nil
in = inch
case val = <- in:
out = outch
in = nil
}
}
}()
 
go func() {
for r := range outch {
fmt.Println( "result:",r)
}
}()
 
time.Sleep (0)
inch <- 1
inch <- 2
time.Sleep (3 * time.Second)
}

传值方法的接收者没法修改原有的值

方法的接收者就像常规的函数参数。若是声明为值,那么你的函数/方法获得的是接收者参数的拷贝。这意味着对接收者所作的修改将不会影响原有的值,除非接收者是一个map或者slice变量,而你更新了集合中的元素,或者你更新的域的接收者是指针。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
package main
 
import "fmt"
 
type data struct {
num int
key * string
items map[string]bool
}
 
func (this *data) pmethod() {
this.num = 7
}
 
func (this data) vmethod() {
this.num = 8
*this.key = "v.key"
this.items[ "vmethod"] = true
}
 
func main() {
key := "key.1"
d := data {1,&key,make(map[string]bool)}
 
fmt.Printf( "num=%v key=%v items=%v\n",d.num,*d.key,d.items)
//prints num=1 key=key.1 items=map[]
 
d.pmethod()
fmt.Printf( "num=%v key=%v items=%v\n",d.num,*d.key,d.items)
//prints num=7 key=key.1 items=map[]
 
d.vmethod()
fmt.Printf( "num=%v key=%v items=%v\n",d.num,*d.key,d.items)
//prints num=7 key=v.key items=map[vmethod:true]
}

中级

关闭HTTP的响应

当你使用标准http库发起请求时,你获得一个http的响应变量。若是你不读取响应主体,你依旧须要关闭它。注意对于空的响应你也必定要这么作。对于新的Go开发者而言,这个很容易就会忘掉。

一些新的Go开发者确实尝试关闭响应主体,但他们在错误的地方作。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
package main
 
import (
"fmt"
"net/http"
"io/ioutil"
)
 
func main() {
resp, err := http.Get( "https://api.ipify.org?format=json")
defer resp.Body.Close()//not ok
if err != nil {
fmt.Println(err)
return
}
 
body, err := ioutil.ReadAll(resp.Body)
if err != nil {
fmt.Println(err)
return
}
 
fmt.Println( string(body))
}

这段代码对于成功的请求没问题,但若是http的请求失败,resp变量可能会是nil,这将致使一个runtime panic

最多见的关闭响应主体的方法是在http响应的错误检查后调用defer

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
package main
 
import (
"fmt"
"net/http"
"io/ioutil"
)
 
func main() {
resp, err := http.Get( "https://api.ipify.org?format=json")
if err != nil {
fmt.Println(err)
return
}
 
defer resp.Body.Close()//ok, most of the time :-)
body, err := ioutil.ReadAll(resp.Body)
if err != nil {
fmt.Println(err)
return
}
 
fmt.Println( string(body))
}

大多数状况下,当你的http响应失败时,resp变量将为nil,而err变量将是non-nil。然而,当你获得一个重定向的错误时,两个变量都将是non-nil。这意味着你最后依然会内存泄露。

经过在http响应错误处理中添加一个关闭non-nil响应主体的的调用来修复这个问题。另外一个方法是使用一个defer调用来关闭全部失败和成功的请求的响应主体。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
package main
 
import (
"fmt"
"net/http"
"io/ioutil"
)
 
func main() {
resp, err := http.Get( "https://api.ipify.org?format=json")
if resp != nil {
defer resp.Body.Close()
}
 
if err != nil {
fmt.Println(err)
return
}
 
body, err := ioutil.ReadAll(resp.Body)
if err != nil {
fmt.Println(err)
return
}
 
fmt.Println( string(body))
}

resp.Body.Close()的原始实现也会读取并丢弃剩余的响应主体数据。这确保了http的连接在keepalive http链接行为开启的状况下,能够被另外一个请求复用。最新的http客户端的行为是不一样的。如今读取并丢弃剩余的响应数据是你的职责。若是你不这么作,http的链接可能会关闭,而没法被重用。这个小技巧应该会写在Go 1.5的文档中。

若是http链接的重用对你的应用很重要,你可能须要在响应处理逻辑的后面添加像下面的代码:

1
_, err = io.Copy(ioutil.Discard, resp.Body)

若是你不当即读取整个响应将是必要的,这可能在你处理json API响应时会发生:

1
json.NewDecoder(resp.Body).Decode(&data)

关闭HTTP的链接

一些HTTP服务器保持会保持一段时间的网络链接(根据HTTP 1.1的说明和服务器端的“keep-alive”配置)。默认状况下,标准http库只在目标HTTP服务器要求关闭时才会关闭网络链接。这意味着你的应用在某些条件下消耗完sockets/file的描述符。

你能够经过设置请求变量中的Close域的值为true,来让http库在请求完成时关闭链接。

另外一个选项是添加一个Connection的请求头,并设置为close。目标HTTP服务器应该也会响应一个Connection: close的头。当http库看到这个响应头时,它也将会关闭链接。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
package main
 
import (
"fmt"
"net/http"
"io/ioutil"
)
 
func main() {
req, err := http.NewRequest( "GET","http://golang.org",nil)
if err != nil {
fmt.Println(err)
return
}
 
req.Close = true
//or do this:
//req.Header.Add("Connection", "close")
 
resp, err := http.DefaultClient.Do(req)
if resp != nil {
defer resp.Body.Close()
}
 
if err != nil {
fmt.Println(err)
return
}
 
body, err := ioutil.ReadAll(resp.Body)
if err != nil {
fmt.Println(err)
return
}
 
fmt.Println( len(string(body)))
}

你也能够取消http的全局链接复用。你将须要为此建立一个自定义的http传输配置。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
package main
 
import (
"fmt"
"net/http"
"io/ioutil"
)
 
func main() {
tr := &http.Transport{DisableKeepAlives: true}
client := &http.Client{Transport: tr}
 
resp, err := client.Get( "http://golang.org")
if resp != nil {
defer resp.Body.Close()
}
 
if err != nil {
fmt.Println(err)
return
}
 
fmt.Println(resp.StatusCode)
 
body, err := ioutil.ReadAll(resp.Body)
if err != nil {
fmt.Println(err)
return
}
 
fmt.Println( len(string(body)))
}

若是你向同一个HTTP服务器发送大量的请求,那么把保持网络链接的打开是没问题的。然而,若是你的应用在短期内向大量不一样的HTTP服务器发送一两个请求,那么在引用收到响应后马上关闭网络链接是一个好主意。增长打开文件的限制数可能也是个好主意。固然,正确的选择源自于应用。

比较Structs, Arrays, Slices, and Maps

若是结构体中的各个元素均可以用你可使用等号来比较的话,那就可使用相号, ==,来比较结构体变量。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
package main
 
import "fmt"
 
type data struct {
num int
fp float32
complex complex64
str string
char rune
yes bool
events <- chan string
handler interface{}
ref * byte
raw [10]byte
}
 
func main() {
v1 := data{}
v2 := data{}
fmt.Println( "v1 == v2:",v1 == v2) //prints: v1 == v2: true
}

若是结构体中的元素没法比较,那使用等号将致使编译错误。注意数组仅在它们的数据元素可比较的状况下才能够比较。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
package main
 
import "fmt"
 
type data struct {
num int //ok
checks [10]func() bool //not comparable
doit func() bool //not comparable
m map[string] string //not comparable
bytes [] byte //not comparable
}
 
func main() {
v1 := data{}
v2 := data{}
fmt.Println( "v1 == v2:",v1 == v2)
}

Go确实提供了一些助手函数,用于比较那些没法使用等号比较的变量。

最经常使用的方法是使用reflect包中的DeepEqual()函数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
package main
 
import (
"fmt"
"reflect"
)
 
type data struct {
num int //ok
checks [10]func() bool //not comparable
doit func() bool //not comparable
m map[string] string //not comparable
bytes [] byte //not comparable
}
 
func main() {
v1 := data{}
v2 := data{}
fmt.Println( "v1 == v2:",reflect.DeepEqual(v1,v2)) //prints: v1 == v2: true
 
m1 := map[string]string{"one": "a","two": "b"}
m2 := map[string]string{"two": "b", "one": "a"}
fmt.Println( "m1 == m2:",reflect.DeepEqual(m1, m2)) //prints: m1 == m2: true
 
s1 := [] int{1, 2, 3}
s2 := [] int{1, 2, 3}
fmt.Println( "s1 == s2:",reflect.DeepEqual(s1, s2)) //prints: s1 == s2: true
}

除了很慢(这个可能会也可能不会影响你的应用),DeepEqual()也有其余自身的技巧。

1
2
3
4
5
6
7
8
9
10
11
12
package main
 
import (
"fmt"
"reflect"
)
 
func main() {
var b1 []byte = nil
b2 := [] byte{}
fmt.Println( "b1 == b2:",reflect.DeepEqual(b1, b2)) //prints: b1 == b2: false
}

DeepEqual()不会认为空的slice与“nil”的slice相等。这个行为与你使用bytes.Equal()函数的行为不一样。bytes.Equal()认为“nil”和空的slice是相等的。

1
2
3
4
5
6
7
8
9
10
11
12
package main
 
import (
"fmt"
"bytes"
)
 
func main() {
var b1 []byte = nil
b2 := [] byte{}
fmt.Println( "b1 == b2:",bytes.Equal(b1, b2)) //prints: b1 == b2: true
}

DeepEqual()在比较slice时并不老是完美的。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
package main
 
import (
"fmt"
"reflect"
"encoding/json"
)
 
func main() {
var str string = "one"
var in interface{} = "one"
fmt.Println( "str == in:",str == in,reflect.DeepEqual(str, in))
//prints: str == in: true true
 
v1 := [] string{"one","two"}
v2 := [] interface{}{"one","two"}
fmt.Println( "v1 == v2:",reflect.DeepEqual(v1, v2))
//prints: v1 == v2: false (not ok)
 
data := map[string]interface{}{
"code": 200,
"value": []string{"one","two"},
}
encoded, _ := json.Marshal(data)
var decoded map[string]interface{}
json.Unmarshal(encoded, &decoded)
fmt.Println( "data == decoded:",reflect.DeepEqual(data, decoded))
//prints: data == decoded: false (not ok)
}

若是你的byte slice(或者字符串)中包含文字数据,而当你要不区分大小写形式的值时(在使用==bytes.Equal(),或者bytes.Compare()),你可能会尝试使用“bytes”和“string”包中的ToUpper()或者ToLower()函数。对于英语文本,这么作是没问题的,但对于许多其余的语言来讲就不行了。这时应该使用strings.EqualFold()bytes.EqualFold()

若是你的byte slice中包含须要验证用户数据的隐私信息(好比,加密哈希、tokens等),不要使用reflect.DeepEqual()bytes.Equal(),或者bytes.Compare(),由于这些函数将会让你的应用易于被定时攻击。为了不泄露时间信息,使用'crypto/subtle'包中的函数(即,subtle.ConstantTimeCompare())。

从Panic中恢复

recover()函数能够用于获取/拦截panic。仅当在一个defer函数中被完成时,调用recover()将会完成这个小技巧。

Incorrect:

1
2
3
4
5
6
7
8
9
10
package main
 
import "fmt"
 
func main() {
recover() //doesn't do anything
panic("not good")
recover() //won't be executed :)
fmt.Println( "ok")
}

Works:

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "fmt"
 
func main() {
defer func() {
fmt.Println( "recovered:",recover())
}()
 
panic("not good")
}

recover()的调用仅当它在defer函数中被直接调用时才有效。

Fails:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
package main
 
import "fmt"
 
func doRecover() {
fmt.Println( "recovered =>",recover()) //prints: recovered => <nil>
}
 
func main() {
defer func() {
doRecover() //panic is not recovered
}()
 
panic("not good")
}

在Slice, Array, and Map "range"语句中更新引用元素的值

在“range”语句中生成的数据的值是真实集合元素的拷贝。它们不是原有元素的引用。
这意味着更新这些值将不会修改原来的数据。同时也意味着使用这些值的地址将不会获得原有数据的指针。

1
2
3
4
5
6
7
8
9
10
11
12
package main
 
import "fmt"
 
func main() {
data := [] int{1,2,3}
for _,v := range data {
v *= 10 //original item is not changed
}
 
fmt.Println( "data:",data) //prints data: [1 2 3]
}

若是你须要更新原有集合中的数据,使用索引操做符来得到数据。

1
2
3
4
5
6
7
8
9
10
11
12
package main
 
import "fmt"
 
func main() {
data := [] int{1,2,3}
for i,_ := range data {
data[i] *= 10
}
 
fmt.Println( "data:",data) //prints data: [10 20 30]
}

若是你的集合保存的是指针,那规则会稍有不一样。
若是要更新原有记录指向的数据,你依然须要使用索引操做,但你可使用for range语句中的第二个值来更新存储在目标位置的数据。

1
2
3
4
5
6
7
8
9
10
11
12
13
package main
 
import "fmt"
 
func main() {
data := []* struct{num int} { {1},{2},{3} }
 
for _,v := range data {
v.num *= 10
}
 
fmt.Println(data [0],data[1],data[2]) //prints &{10} &{20} &{30}
}

在Slice中"隐藏"数据

当你从新划分一个slice时,新的slice将引用原有slice的数组。若是你忘了这个行为的话,在你的应用分配大量临时的slice用于建立新的slice来引用原有数据的一小部分时,会致使难以预期的内存使用。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
package main
 
import "fmt"
 
func get() []byte {
raw := make([]byte,10000)
fmt.Println( len(raw),cap(raw),&raw[0]) //prints: 10000 10000 <byte_addr_x>
return raw[:3]
}
 
func main() {
data := get()
fmt.Println( len(data),cap(data),&data[0]) //prints: 3 10000 <byte_addr_x>
}

为了不这个陷阱,你须要从临时的slice中拷贝数据(而不是从新划分slice)。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
package main
 
import "fmt"
 
func get() []byte {
raw := make([]byte,10000)
fmt.Println( len(raw),cap(raw),&raw[0]) //prints: 10000 10000 <byte_addr_x>
res := make([]byte,3)
copy(res,raw[:3])
return res
}
 
func main() {
data := get()
fmt.Println( len(data),cap(data),&data[0]) //prints: 3 3 <byte_addr_y>
}

Slice的数据“毁坏”

好比说你须要从新一个路径(在slice中保存)。你经过修改第一个文件夹的名字,而后把名字合并来建立新的路劲,来从新划分指向各个文件夹的路径。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
package main
 
import (
"fmt"
"bytes"
)
 
func main() {
path := [] byte("AAAA/BBBBBBBBB")
sepIndex := bytes.IndexByte(path, '/')
dir1 := path[:sepIndex]
dir2 := path[sepIndex +1:]
fmt.Println( "dir1 =>",string(dir1)) //prints: dir1 => AAAA
fmt.Println( "dir2 =>",string(dir2)) //prints: dir2 => BBBBBBBBB
 
dir1 = append(dir1,"suffix"...)
path = bytes.Join([][] byte{dir1,dir2},[]byte{'/'})
 
fmt.Println( "dir1 =>",string(dir1)) //prints: dir1 => AAAAsuffix
fmt.Println( "dir2 =>",string(dir2)) //prints: dir2 => uffixBBBB (not ok)
 
fmt.Println( "new path =>",string(path))
}

结果与你想的不同。与"AAAAsuffix/BBBBBBBBB"相反,你将会获得"AAAAsuffix/uffixBBBB"。这个状况的发生是由于两个文件夹的slice都潜在的引用了同一个原始的路径slice。这意味着原始路径也被修改了。根据你的应用,这也许会是个问题。

经过分配新的slice并拷贝须要的数据,你能够修复这个问题。另外一个选择是使用完整的slice表达式。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
package main
 
import (
"fmt"
"bytes"
)
 
func main() {
path := [] byte("AAAA/BBBBBBBBB")
sepIndex := bytes.IndexByte(path, '/')
dir1 := path[:sepIndex:sepIndex] //full slice expression
dir2 := path[sepIndex +1:]
fmt.Println( "dir1 =>",string(dir1)) //prints: dir1 => AAAA
fmt.Println( "dir2 =>",string(dir2)) //prints: dir2 => BBBBBBBBB
 
dir1 = append(dir1,"suffix"...)
path = bytes.Join([][] byte{dir1,dir2},[]byte{'/'})
 
fmt.Println( "dir1 =>",string(dir1)) //prints: dir1 => AAAAsuffix
fmt.Println( "dir2 =>",string(dir2)) //prints: dir2 => BBBBBBBBB (ok now)
 
fmt.Println( "new path =>",string(path))
}

完整的slice表达式中的额外参数能够控制新的slice的容量。如今在那个slice后添加元素将会触发一个新的buffer分配,而不是覆盖第二个slice中的数据。

陈旧的(Stale)Slices

多个slice能够引用同一个数据。好比,当你从一个已有的slice建立一个新的slice时,这就会发生。若是你的应用功能须要这种行为,那么你将须要关注下“走味的”slice。

在某些状况下,在一个slice中添加新的数据,在原有数组没法保持更多新的数据时,将致使分配一个新的数组。而如今其余的slice还指向老的数组(和老的数据)。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
import "fmt"
 
func main() {
s1 := [] int{1,2,3}
fmt.Println( len(s1),cap(s1),s1) //prints 3 3 [1 2 3]
 
s2 := s1 [1:]
fmt.Println( len(s2),cap(s2),s2) //prints 2 2 [2 3]
 
for i := range s2 { s2[i] += 20 }
 
//still referencing the same array
fmt.Println(s1) //prints [1 22 23]
fmt.Println(s2) //prints [22 23]
 
s2 = append(s2,4)
 
for i := range s2 { s2[i] += 10 }
 
//s1 is now "stale"
fmt.Println(s1) //prints [1 22 23]
fmt.Println(s2) //prints [32 33 14]
}

类型声明和方法

当你经过把一个现有(非interface)的类型定义为一个新的类型时,新的类型不会继承现有类型的方法。

Fails:

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "sync"
 
type myMutex sync.Mutex
 
func main() {
var mtx myMutex
mtx.Lock() //error
mtx.Unlock() //error
}

Compile Errors:

/tmp/sandbox106401185/main.go:9: mtx.Lock undefined (type myMutex has no field or method Lock) /tmp/sandbox106401185/main.go:10: mtx.Unlock undefined (type myMutex has no field or method Unlock)

若是你确实须要原有类型的方法,你能够定义一个新的struct类型,用匿名方式把原有类型嵌入其中。

Works:

1
2
3
4
5
6
7
8
9
10
11
12
13
package main
 
import "sync"
 
type myLocker struct {
sync.Mutex
}
 
func main() {
var lock myLocker
lock.Lock() //ok
lock.Unlock() //ok
}

interface类型的声明也会保留它们的方法集合。
Works:

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "sync"
 
type myLocker sync.Locker
 
func main() {
var lock myLocker = new(sync.Mutex)
lock.Lock() //ok
lock.Unlock() //ok
}

从"for switch"和"for select"代码块中跳出

没有标签的“break”声明只能从内部的switch/select代码块中跳出来。若是没法使用“return”声明的话,那就为外部循环定义一个标签是另外一个好的选择。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
package main
 
import "fmt"
 
func main() {
loop:
for {
switch {
case true:
fmt.Println( "breaking out...")
break loop
}
}
 
fmt.Println( "out!")
}

"goto"声明也能够完成这个功能。。。

"for"声明中的迭代变量和闭包

这在Go中是个很常见的技巧。for语句中的迭代变量在每次迭代时被从新使用。这就意味着你在for循环中建立的闭包(即函数字面量)将会引用同一个变量(而在那些goroutine开始执行时就会获得那个变量的值)。

Incorrect:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
package main
 
import (
"fmt"
"time"
)
 
func main() {
data := [] string{"one","two","three"}
 
for _,v := range data {
go func() {
fmt.Println(v)
}()
}
 
time.Sleep (3 * time.Second)
//goroutines print: three, three, three
}

最简单的解决方法(不须要修改goroutine)是,在for循环代码块内把当前迭代的变量值保存到一个局部变量中。

Works:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
package main
 
import (
"fmt"
"time"
)
 
func main() {
data := [] string{"one","two","three"}
 
for _,v := range data {
vcopy := v //
go func() {
fmt.Println(vcopy)
}()
}
 
time.Sleep (3 * time.Second)
//goroutines print: one, two, three
}

另外一个解决方法是把当前的迭代变量做为匿名goroutine的参数。

Works:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
package main
 
import (
"fmt"
"time"
)
 
func main() {
data := [] string{"one","two","three"}
 
for _,v := range data {
go func(in string) {
fmt.Println(in)
}(v)
}
 
time.Sleep (3 * time.Second)
//goroutines print: one, two, three
}

下面这个陷阱稍微复杂一些的版本。

Incorrect:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
package main
 
import (
"fmt"
"time"
)
 
type field struct {
name string
}
 
func (p *field) print() {
fmt.Println(p.name)
}
 
func main() {
data := []field{ { "one"},{"two"},{"three"} }
 
for _,v := range data {
go v.print()
}
 
time.Sleep (3 * time.Second)
//goroutines print: three, three, three
}

Works:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
package main
 
import (
"fmt"
"time"
)
 
type field struct {
name string
}
 
func (p *field) print() {
fmt.Println(p.name)
}
 
func main() {
data := []field{ { "one"},{"two"},{"three"} }
 
for _,v := range data {
v := v
go v.print()
}
 
time.Sleep (3 * time.Second)
//goroutines print: one, two, three
}

在运行这段代码时你认为会看到什么结果?(缘由是什么?)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
package main
 
import (
"fmt"
"time"
)
 
type field struct {
name string
}
 
func (p *field) print() {
fmt.Println(p.name)
}
 
func main() {
data := []*field{ { "one"},{"two"},{"three"} }
 
for _,v := range data {
go v.print()
}
 
time.Sleep (3 * time.Second)
}

Defer函数调用参数的求值

defer的函数的参数会在defer声明时求值(而不是在函数实际执行时)。
Arguments for a deferred function call are evaluated when the defer statement is evaluated (not when the function is actually executing).

1
2
3
4
5
6
7
8
9
10
11
package main
 
import "fmt"
 
func main() {
var i int = 1
 
defer fmt.Println("result =>",func() int { return i * 2 }())
i++
//prints: result => 2 (not ok if you expected 4)
}

被Defer的函数调用执行

被defer的调用会在包含的函数的末尾执行,而不是包含代码块的末尾。对于Go新手而言,一个很常犯的错误就是没法区分被defer的代码执行规则和变量做用规则。若是你有一个长时运行的函数,而函数内有一个for循环试图在每次迭代时都defer资源清理调用,那就会出现问题。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
package main
 
import (
"fmt"
"os"
"path/filepath"
)
 
func main() {
if len(os.Args) != 2 {
os.Exit (-1)
}
 
start, err := os.Stat(os.Args [1])
if err != nil || !start.IsDir(){
os.Exit (-1)
}
 
var targets []string
filepath.Walk(os.Args [1], func(fpath string, fi os.FileInfo, err error) error {
if err != nil {
return err
}
 
if !fi.Mode().IsRegular() {
return nil
}
 
targets = append(targets,fpath)
return nil
})
 
for _,target := range targets {
f, err := os.Open(target)
if err != nil {
fmt.Println( "bad target:",target,"error:",err) //prints error: too many open files
break
}
defer f.Close() //will not be closed at the end of this code block
//do something with the file...
}
}

解决这个问题的一个方法是把代码块写成一个函数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
package main
 
import (
"fmt"
"os"
"path/filepath"
)
 
func main() {
if len(os.Args) != 2 {
os.Exit (-1)
}
 
start, err := os.Stat(os.Args [1])
if err != nil || !start.IsDir(){
os.Exit (-1)
}
 
var targets []string
filepath.Walk(os.Args [1], func(fpath string, fi os.FileInfo, err error) error {
if err != nil {
return err
}
 
if !fi.Mode().IsRegular() {
return nil
}
 
targets = append(targets,fpath)
return nil
})
 
for _,target := range targets {
func() {
f, err := os.Open(target)
if err != nil {
fmt.Println( "bad target:",target,"error:",err)
return
}
defer f.Close() //ok
//do something with the file...
}()
}
}

另外一个方法是去掉defer语句 :-)

失败的类型断言

失败的类型断言返回断言声明中使用的目标类型的“零值”。这在与隐藏变量混合时,会发生未知状况。

Incorrect:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
package main
 
import "fmt"
 
func main() {
var data interface{} = "great"
 
if data, ok := data.(int); ok {
fmt .Println("[is an int] value =>",data)
} else {
fmt .Println("[not an int] value =>",data)
//prints: [not an int] value => 0 (not "great")
}
}

Works:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
package main
 
import "fmt"
 
func main() {
var data interface{} = "great"
 
if res, ok := data.(int); ok {
fmt.Println( "[is an int] value =>",res)
} else {
fmt.Println( "[not an int] value =>",data)
//prints: [not an int] value => great (as expected)
}
}

阻塞的Goroutine和资源泄露

Rob Pike在2012年的Google I/O大会上所作的“Go Concurrency Patterns”的演讲上,说道过几种基础的并发模式。从一组目标中获取第一个结果就是其中之一。

1
2
3
4
5
6
7
8
func First(query string, replicas ...Search) Result {
c := make(chan Result)
searchReplica := func(i int) { c <- replicas[i](query) }
for i := range replicas {
go searchReplica(i)
}
return <-c
}

这个函数在每次搜索重复时都会起一个goroutine。每一个goroutine把它的搜索结果发送到结果的channel中。结果channel的第一个值被返回。

那其余goroutine的结果会怎样呢?还有那些goroutine自身呢?

First()函数中的结果channel是没缓存的。这意味着只有第一个goroutine返回。其余的goroutine会困在尝试发送结果的过程当中。这意味着,若是你有不止一个的重复时,每一个调用将会泄露资源。

为了不泄露,你须要确保全部的goroutine退出。一个不错的方法是使用一个有足够保存全部缓存结果的channel。

1
2
3
4
5
6
7
8
func First(query string, replicas ...Search) Result {
c := make(chan Result,len(replicas))
searchReplica := func(i int) { c <- replicas[i](query) }
for i := range replicas {
go searchReplica(i)
}
return <-c
}

另外一个不错的解决方法是使用一个有default状况的select语句和一个保存一个缓存结果的channel。default状况保证了即便当结果channel没法收到消息的状况下,goroutine也不会堵塞。

1
2
3
4
5
6
7
8
9
10
11
12
13
func First(query string, replicas ...Search) Result {
c := make(chan Result,1)
searchReplica := func(i int) {
select {
case c <- replicas[i](query):
default:
}
}
for i := range replicas {
go searchReplica(i)
}
return <-c
}

你也可使用特殊的取消channel来终止workers。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
func First(query string, replicas ...Search) Result {
c := make(chan Result)
done := make(chan struct{})
defer close(done)
searchReplica := func(i int) {
select {
case c <- replicas[i](query):
case <- done:
}
}
for i := range replicas {
go searchReplica(i)
}
 
return <-c
}

为什么在演讲中会包含这些bug?Rob Pike仅仅是不想把演示复杂化。这么做是合理的,但对于Go新手而言,可能会直接使用代码,而不去思考它可能有问题。

高级

使用指针接收方法的值的实例

只要值是可取址的,那在这个值上调用指针接收方法是没问题的。换句话说,在某些状况下,你不须要在有一个接收值的方法版本。

然而并非全部的变量是可取址的。Map的元素就不是。经过interface引用的变量也不是。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
package main
 
import "fmt"
 
type data struct {
name string
}
 
func (p *data) print() {
fmt.Println( "name:",p.name)
}
 
type printer interface {
print()
}
 
func main() {
d1 := data{ "one"}
d1. print() //ok
 
var in printer = data{"two"} //error
in. print()
 
m := map[string]data {"x":data{"three"}}
m[ "x"].print() //error
}

Compile Errors:

/tmp/sandbox017696142/main.go:21: cannot use data literal (type data) as type printer in assignment: data does not implement printer (print method has pointer receiver)
/tmp/sandbox017696142/main.go:25: cannot call pointer method on m["x"]
/tmp/sandbox017696142/main.go:25: cannot take the address of m["x"]

更新Map的值

若是你有一个struct值的map,你没法更新单个的struct值。

Fails:

1
2
3
4
5
6
7
8
9
10
package main
 
type data struct {
name string
}
 
func main() {
m := map[string]data {"x":{"one"}}
m[ "x"].name = "two" //error
}

Compile Error:

/tmp/sandbox380452744/main.go:9: cannot assign to m["x"].name

这个操做无效是由于map元素是没法取址的。

而让Go新手更加困惑的是slice元素是能够取址的。

1
2
3
4
5
6
7
8
9
10
11
12
13
package main
 
import "fmt"
 
type data struct {
name string
}
 
func main() {
s := []data one
s [0].name = "two" //ok
fmt.Println(s) //prints: [{two}]
}

注意在不久以前,使用编译器之一(gccgo)是能够更新map的元素值的,但这一行为很快就被修复了 :-)它也被认为是Go 1.3的潜在特性。在那时还不是要急需支持的,但依旧在todo list中。

第一个有效的方法是使用一个临时变量。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
package main
 
import "fmt"
 
type data struct {
name string
}
 
func main() {
m := map[string]data {"x":{"one"}}
r := m[ "x"]
r.name = "two"
m[ "x"] = r
fmt.Printf( "%v",m) //prints: map[x:{two}]
}

另外一个有效的方法是使用指针的map。

1
2
3
4
5
6
7
8
9
10
11
12
13
package main
 
import "fmt"
 
type data struct {
name string
}
 
func main() {
m := map[string]*data {"x":{"one"}}
m[ "x"].name = "two" //ok
fmt.Println(m[ "x"]) //prints: &{two}
}

顺便说下,当你运行下面的代码时会发生什么?

1
2
3
4
5
6
7
8
9
10
package main
 
type data struct {
name string
}
 
func main() {
m := map[string]*data {"x":{"one"}}
m[ "z"].name = "what?" //???
}

"nil" Interfaces和"nil" Interfaces的值

这在Go中是第二最多见的技巧,由于interface虽然看起来像指针,但并非指针。interface变量仅在类型和值为“nil”时才为“nil”。

interface的类型和值会根据用于建立对应interface变量的类型和值的变化而变化。当你检查一个interface变量是否等于“nil”时,这就会致使未预期的行为。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
package main
 
import "fmt"
 
func main() {
var data *byte
var in interface{}
 
fmt.Println(data,data == nil) //prints: <nil> true
fmt.Println(in,in == nil) //prints: <nil> true
 
in = data
fmt.Println(in,in == nil) //prints: <nil> false
//'data' is 'nil', but 'in' is not 'nil'
}

当你的函数返回interface时,当心这个陷阱。

Incorrect:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
package main
 
import "fmt"
 
func main() {
doit := func(arg int) interface{} {
var result *struct{} = nil
 
if(arg > 0) {
result = & struct{}{}
}
 
return result
}
 
if res := doit(-1); res != nil {
fmt.Println( "good result:",res) //prints: good result: <nil>
//'res' is not 'nil', but its value is 'nil'
}
}

Works:

1
2
3
4
5
6
7
8
9
10
11
12
package main
 
import "fmt"
 
func main() {
doit := func(arg int) interface{} {
var result *struct{} = nil
 
if(arg > 0) {
result = & struct{}{}
} else {
ret

栈和堆变量

你并不老是知道变量是分配到栈仍是堆上。在C++中,使用new建立的变量老是在堆上。在Go中,即便是使用new()或者make()函数来分配,变量的位置仍是由编译器决定。编译器根据变量的大小和“泄露分析”的结果来决定其位置。这也意味着在局部变量上返回引用是没问题的,而这在C或者C++这样的语言中是不行的。

若是你想知道变量分配的位置,在“go build”或“go run”上传入“-m“ gc标志(即,go run -gcflags -m app.go)。

GOMAXPROCS, 并发, 和并行

默认状况下,Go仅使用一个执行上下文/OS线程(在当前的版本)。这个数量能够经过设置GOMAXPROCS来提升。

一个常见的误解是,GOMAXPROCS表示了CPU的数量,Go将使用这个数量来运行goroutine。而runtime.GOMAXPROCS()函数的文档让人更加的迷茫。GOMAXPROCS变量描述(https://golang.org/pkg/runtime/)所讨论OS线程的内容比较好。

你能够设置GOMAXPROCS的数量大于CPU的数量。GOMAXPROCS的最大值是256。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
package main
 
import (
"fmt"
"runtime"
)
 
func main() {
fmt.Println(runtime.GOMAXPROCS (-1)) //prints: 1
fmt.Println(runtime.NumCPU()) //prints: 1 (on play.golang.org)
runtime.GOMAXPROCS (20)
fmt.Println(runtime.GOMAXPROCS (-1)) //prints: 20
runtime.GOMAXPROCS (300)
fmt.Println(runtime.GOMAXPROCS (-1)) //prints: 256
}

读写操做的重排顺序

Go可能会对某些操做进行从新排序,但它能保证在一个goroutine内的全部行为顺序是不变的。然而,它并不保证多goroutine的执行顺序。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
package main
 
import (
"runtime"
"time"
)
 
var _ = runtime.GOMAXPROCS(3)
 
var a, b int
 
func u1() {
a = 1
b = 2
}
 
func u2() {
a = 3
b = 4
}
 
func p() {
println(a)
println(b)
}
 
func main() {
go u1()
go u2()
go p()
time.Sleep (1 * time.Second)
}

若是你多运行几回上面的代码,你可能会发现a和b变量有多个不一样的组合:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
1
2
 
3
4
 
0
2
 
0
0
 
1
4

ab最有趣的组合式是"02"。这代表ba以前更新了。

若是你须要在多goroutine内放置读写顺序的变化,你将须要使用channel,或者使用"sync"包构建合适的结构体。

优先调度

有可能会出现这种状况,一个无耻的goroutine阻止其余goroutine运行。当你有一个不让调度器运行的for循环时,这就会发生。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
package main
 
import "fmt"
 
func main() {
done := false
 
go func(){
done = true
}()
 
for !done {
}
fmt.Println( "done!")
}

for循环并不须要是空的。只要它包含了不会触发调度执行的代码,就会发生这种问题。

调度器会在GC、“go”声明、阻塞channel操做、阻塞系统调用和lock操做后运行。它也会在非内联函数调用后执行。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
package main
 
import "fmt"
 
func main() {
done := false
 
go func(){
done = true
}()
 
for !done {
fmt.Println( "not done!") //not inlined
}
fmt.Println( "done!")
}

要想知道你在for循环中调用的函数是不是内联的,你能够在“go build”或“go run”时传入“-m” gc标志(如, go build -gcflags -m)。

另外一个选择是显式的唤起调度器。你可使用“runtime”包中的Goshed()函数。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
package main
 
import (
"fmt"
"runtime"
)
 
func main() {
done := false
 
go func(){
done = true
}()
 
for !done {
runtime.Gosched()
}
fmt.Println( "done!")
}
相关文章
相关标签/搜索