Go 语言反射三定律

时间 2019-11-10

标签语言反射定律繁體版

原文原文链接

简介

Reflection（反射）在计算机中表示程序可以检查自身结构的能力，尤为是类型。它是元编程的一种形式，也是最容易让人迷惑的一部分。golang

本文中，咱们将解释Go语言中反射的运做机制。每一个编程语言的反射模型不大相同，不少语言索性就不支持反射（C、C++）。因为本文是介绍Go语言的，因此当咱们谈到“反射”时，默认为是Go语言中的反射。编程

阅读建议

本文中，咱们将解释Go语言中反射的运做机制。每一个编程语言的反射模型不大相同，不少语言索性就不支持反射（C、C++）。微信

因为本文是介绍Go语言的，因此当咱们谈到“反射”时，默认为是Go语言中的反射。编程语言

虽然Go语言没有继承的概念，但为了便于理解，若是一个struct A 实现了 interface B的全部方法时，咱们称之为“继承”。函数

类型和接口

反射创建在类型系统之上，所以咱们从类型基础知识提及。工具

Go是静态类型语言。每一个变量都有且只有一个静态类型，在编译时就已经肯定。好比 int、float3二、*MyType、[]byte。若是咱们作出以下声明：ui

type MyInt int

var i int
var j MyInt

上面的代码中，变量 i 的类型是 int，j 的类型是 MyInt。因此，尽管变量 i 和 j 具备共同的底层类型 int，但它们的静态类型并不同。不通过类型转换直接相互赋值时，编译器会报错。spa

关于类型，一个重要的分类是接口类型（interface），每一个接口类型都表明固定的方法集合。一个接口变量就能够存储（或“指向”，接口变量相似于指针）任何类型的具体值，只要这个值实现了该接口类型的全部方法。一组广为人知的例子是 io.Reader 和 io.Writer， Reader 和 Writer 类型来源于 io包，声明以下：翻译

// Reader is the interface that wraps the basic Read method.
type Reader interface {
    Read(p []byte) (n int, err error)
}

// Writer is the interface that wraps the basic Write method.
type Writer interface {
    Write(p []byte) (n int, err error)
}

任何实现了 Read（Write）方法的类型，咱们都称之为继承了 io.Reader（io.Writer）接口。换句话说，一个类型为 io.Reader 的变量能够指向（接口变量相似于指针）任何类型的变量，只要这个类型实现了Read 方法：设计

var r io.Reader
r = os.Stdin
r = bufio.NewReader(r)
r = new(bytes.Buffer)
// and so on

要时刻牢记：无论变量 r 指向的具体值是什么，它的类型永远是 io.Reader。再重复一次：Go语言是静态类型语言，变量 r 的静态类型是 io.Reader。

一个很是很是重要的接口类型是空接口，即：

interface{}

它表明一个空集，没有任何方法。因为任何具体的值都有零或更多个方法，所以类型为interface{} 的变量可以存储任何值。

有人说，Go的接口是动态类型的。这个说法是错的！接口变量也是静态类型的，它永远只有一个相同的静态类型。若是在运行时它存储的值发生了变化，这个值也必须知足接口类型的方法集合。

因为反射和接口二者的关系很密切，咱们必须澄清这一点。

接口变量的表示

Russ Cox 在2009年写了一篇文章介绍 Go中接口变量的表示形式，具体参考文章末尾的连接“Go语言接口的表示”。这里咱们不须要重复全部的细节，只作一个简单的总结。

Interface变量存储一对值：赋给该变量的具体的值、值类型的描述符。更准确一点来讲，值就是实现该接口的底层数据，类型是底层数据类型的描述。举个例子：

var r io.Reader
tty, err := os.OpenFile("/dev/tty", os.O_RDWR, 0)
if err != nil {
    return nil, err
}
r = tty

在这个例子中，变量 r 在结构上包含一个 (value, type) 对：(tty, os.File)。注意：类型 os.File 不只仅实现了 Read 方法。虽然接口变量只提供 Read 函数的调用权，可是底层的值包含了关于这个值的全部类型信息。因此咱们可以作这样的类型转换：

var w io.Writer
w = r.(io.Writer)

上面代码的第二行是一个类型断言，它判定变量 r 内部的实际值也继承了 io.Writer接口，因此才能被赋值给 w。赋值以后，w 就指向了 (tty, *os.File) 对，和变量 r 指向的是同一个 (value, type) 对。无论底层具体值的方法集有多大，因为接口的静态类型限制，接口变量只能调用特定的一些方法。

咱们继续往下看：

var empty interface{}
empty = w

这里的空接口变量 empty 也包含 (tty, *os.File) 对。这一点很容易理解：空接口变量能够存储任何具体值以及该值的全部描述信息。

细心的朋友可能会发现，这里没有使用类型断言，由于变量 w 知足空接口的全部方法（传说中的“无招胜有招”）。在前一个例子中，咱们把一个具体值从 io.Reader 转换为 io.Writer 时，须要显式的类型断言，是由于 io.Writer 的方法集合不是 io.Reader 的子集。

另外须要注意的一点是，(value, type) 对中的 type 必须是具体的类型（struct或基本类型），不能是接口类型。接口类型不能存储接口变量。

关于接口，咱们就介绍到这里，下面咱们看看Go语言的反射三定律。

反射第必定律：反射能够将“接口类型变量”转换为“反射类型对象”。

注：这里反射类型指 reflect.Type 和 reflect.Value。

从用法上来说，反射提供了一种机制，容许程序在运行时检查接口变量内部存储的 (value, type) 对。在最开始，咱们先了解下 reflect 包的两种类型：Type 和 Value。这两种类型使访问接口内的数据成为可能。它们对应两个简单的方法，分别是 reflect.TypeOf 和 reflect.ValueOf，分别用来读取接口变量的 reflect.Type 和 reflect.Value 部分。固然，从 reflect.Value 也很容易获取到 reflect.Type。目前咱们先将它们分开。

首先，咱们下看 reflect.TypeOf：

package main

import (
    "fmt"
    "reflect"
)

func main() {
    var x float64 = 3.4
    fmt.Println("type:", reflect.TypeOf(x))
}

这段代码会打印出：

type: float64

你可能会疑惑：为何没看到接口？这段代码看起来只是把一个 float64类型的变量 x 传递给 reflect.TypeOf，并无传递接口。事实上，接口就在那里。查阅一下TypeOf 的文档，你会发现 reflect.TypeOf 的函数签名里包含一个空接口：

// TypeOf returns the reflection Type of the value in the interface{}.
func TypeOf(i interface{}) Type

咱们调用 reflect.TypeOf(x) 时，x 被存储在一个空接口变量中被传递过去；而后reflect.TypeOf 对空接口变量进行拆解，恢复其类型信息。

函数 reflect.ValueOf 也会对底层的值进行恢复（这里咱们忽略细节，只关注可执行的代码）：

var x float64 = 3.4
fmt.Println("value:", reflect.ValueOf(x))

上面这段代码打印出：

value: 3.4

类型 reflect.Type 和 reflect.Value 都有不少方法，咱们能够检查和使用它们。这里咱们举几个例子。类型 reflect.Value 有一个方法 Type()，它会返回一个 reflect.Type 类型的对象。Type和 Value都有一个名为 Kind 的方法，它会返回一个常量，表示底层数据的类型，常见值有：Uint、Float6四、Slice等。Value类型也有一些相似于Int、Float的方法，用来提取底层的数据。Int方法用来提取 int64, Float方法用来提取 float64，参考下面的代码：

var x float64 = 3.4
v := reflect.ValueOf(x)
fmt.Println("type:", v.Type())
fmt.Println("kind is float64:", v.Kind() == reflect.Float64)
fmt.Println("value:", v.Float())

上面这段代码会打印出：

type: float64
kind is float64: true
value: 3.4

还有一些用来修改数据的方法，好比SetInt、SetFloat，在讨论它们以前，咱们要先理解“可修改性”（settability），这一特性会在“反射第三定律”中进行详细说明。

反射库提供了不少值得列出来单独讨论的属性。首先是介绍下Value 的 getter 和 setter 方法。为了保证API 的精简，这两个方法操做的是某一组类型范围最大的那个。好比，处理任何含符号整型数，都使用 int64。也就是说 Value 类型的Int 方法返回值为 int64类型，SetInt 方法接收的参数类型也是 int64 类型。实际使用时，可能须要转化为实际的类型：

var x uint8 = 'x'
v := reflect.ValueOf(x)
fmt.Println("type:", v.Type())                            // uint8.
fmt.Println("kind is uint8: ", v.Kind() == reflect.Uint8) // true.
x = uint8(v.Uint())                // v.Uint returns a uint64.

第二个属性是反射类型变量（reflection object）的 Kind 方法会返回底层数据的类型，而不是静态类型。若是一个反射类型对象包含一个用户定义的整型数，看代码：

type MyInt int
var x MyInt = 7
v := reflect.ValueOf(x)

上面的代码中，虽然变量 v 的静态类型是MyInt，不是 int，Kind 方法仍然返回 reflect.Int。换句话说， Kind 方法不会像 Type 方法同样区分 MyInt 和 int。

反射第二定律：反射能够将“反射类型对象”转换为“接口类型变量”。

和物理学中的反射相似，Go语言中的反射也能创造本身反面类型的对象。

根据一个 reflect.Value 类型的变量，咱们可使用 Interface 方法恢复其接口类型的值。事实上，这个方法会把 type 和 value 信息打包并填充到一个接口变量中，而后返回。其函数声明以下：

// Interface returns v's value as an interface{}.
func (v Value) Interface() interface{}

而后，咱们能够经过断言，恢复底层的具体值：

y := v.Interface().(float64) // y will have type float64.
fmt.Println(y)

上面这段代码会打印出一个 float64 类型的值，也就是反射类型变量 v 所表明的值。

事实上，咱们能够更好地利用这一特性。标准库中的 fmt.Println 和 fmt.Printf 等函数都接收空接口变量做为参数，fmt 包内部会对接口变量进行拆包（前面的例子中，咱们也作过相似的操做）。所以，fmt 包的打印函数在打印 reflect.Value 类型变量的数据时，只须要把 Interface 方法的结果传给格式化打印程序：

fmt.Println(v.Interface())

你可能会问：问什么不直接打印 v ，好比 fmt.Println(v)？答案是 v 的类型是 reflect.Value，咱们须要的是它存储的具体值。因为底层的值是一个 float64，咱们能够格式化打印：

fmt.Printf("value is %7.1e\n", v.Interface())

上面代码的打印结果是：

3.4e+00

一样，此次也不须要对 v.Interface() 的结果进行类型断言。空接口值内部包含了具体值的类型信息，Printf 函数会恢复类型信息。

简单来讲，Interface 方法和 ValueOf 函数做用刚好相反，惟一一点是，返回值的静态类型是 interface{}。

咱们从新表述一下：Go的反射机制能够将“接口类型的变量”转换为“反射类型的对象”，而后再将“反射类型对象”转换过去。

反射第三定律：若是要修改“反射类型对象”，其值必须是“可写的”（settable）。

这条定律很微妙，也很容易让人迷惑。可是若是你从第一条定律开始看，应该比较容易理解。

下面这段代码不能正常工做，可是很是值得研究：

var x float64 = 3.4
v := reflect.ValueOf(x)
v.SetFloat(7.1) // Error: will panic.

若是你运行这段代码，它会抛出抛出一个奇怪的异常：

panic: reflect.Value.SetFloat using unaddressable value

这里问题不在于值 7.1 不能被寻址，而是由于变量 v 是“不可写的”。“可写性”是反射类型变量的一个属性，但不是全部的反射类型变量都拥有这个属性。

咱们能够经过 CanSet 方法检查一个 reflect.Value 类型变量的“可写性”。对于上面的例子，能够这样写：

var x float64 = 3.4
v := reflect.ValueOf(x)
fmt.Println("settability of v:", v.CanSet())

上面这段代码打印结果是：

settability of v: false

对于一个不具备“可写性”的 Value类型变量，调用 Set 方法会报出错误。首先，咱们要弄清楚什么“可写性”。

“可写性”有些相似于寻址能力，可是更严格。它是反射类型变量的一种属性，赋予该变量修改底层存储数据的能力。“可写性”最终是由一个事实决定的：反射对象是否存储了原始值。举个代码例子：

var x float64 = 3.4
v := reflect.ValueOf(x)

这里咱们传递给 reflect.ValueOf 函数的是变量 x 的一个拷贝，而非 x 自己。想象一下，若是下面这行代码可以成功执行：

v.SetFloat(7.1)

答案是：若是这行代码可以成功执行，它不会更新 x ，虽然看起来变量 v 是根据 x 建立的。相反，它会更新 x 存在于反射对象 v 内部的一个拷贝，而变量 x 自己彻底不受影响。这会形成迷惑，而且没有任何意义，因此是不合法的。“可写性”就是为了不这个问题而设计的。

这看起来很诡异，事实上并不是如此，并且相似的状况很常见。考虑下面这行代码：

f(x)

上面的代码中，咱们把变量 x 的一个拷贝传递给函数，所以不指望它会改变 x 的值。若是指望函数 f 可以修改变量 x，咱们必须传递 x 的地址（即指向 x 的指针）给函数 f，以下：

f(&x)

你应该很熟悉这行代码，反射的工做机制是同样的。若是你想经过反射修改变量 x，就咬吧想要修改的变量的指针传递给反射库。

首先，像一般同样初始化变量 x，而后建立一个指向它的反射对象，名字为 p：

var x float64 = 3.4
p := reflect.ValueOf(&x) // Note: take the address of x.
fmt.Println("type of p:", p.Type())
fmt.Println("settability of p:", p.CanSet())

这段代码的输出是：

type of p: *float64
settability of p: false

反射对象 p 是不可写的，可是咱们也不像修改 p，事实上咱们要修改的是 *p。为了获得 p 指向的数据，能够调用 Value 类型的 Elem 方法。Elem 方法可以对指针进行“解引用”，而后将结果存储到反射 Value类型对象 v中：

v := p.Elem()
fmt.Println("settability of v:", v.CanSet())

在上面这段代码中，变量 v 是一个可写的反射对象，代码输出也验证了这一点：

settability of v: true

因为变量 v 表明 x，所以咱们可使用 v.SetFloat 修改 x 的值：

v.SetFloat(7.1)
fmt.Println(v.Interface())
fmt.Println(x)

上面代码的输出以下：

7.1
7.1

反射不太容易理解，reflect.Type 和 reflect.Value 会混淆正在执行的程序，可是它作的事情正是编程语言作的事情。你只须要记住：只要反射对象要修改它们表示的对象，就必须获取它们表示的对象的地址。

结构体（struct）

在前面的例子中，变量 v 自己并非指针，它只是从指针衍生而来。把反射应用到结构体时，经常使用的方式是使用反射修改一个结构体的某些字段。只要拥有结构体的地址，咱们就能够修改它的字段。

下面经过一个简单的例子对结构体类型变量 t 进行分析。

首先，咱们建立了反射类型对象，它包含一个结构体的指针，由于后续会修改。

而后，咱们设置 typeOfT 为它的类型，并遍历全部的字段。

注意：咱们从 struct 类型提取出每一个字段的名字，可是每一个字段自己也是常规的 reflect.Value 对象。

type T struct {
    A int
    B string
}
t := T{23, "skidoo"}
s := reflect.ValueOf(&t).Elem()
typeOfT := s.Type()
for i := 0; i < s.NumField(); i++ {
    f := s.Field(i)
    fmt.Printf("%d: %s %s = %v\n", i,
        typeOfT.Field(i).Name, f.Type(), f.Interface())
}

上面这段代码的输出以下：

0: A int = 23
1: B string = skidoo

这里还有一点须要指出：变量 T 的字段都是首字母大写的（暴露到外部），由于struct中只有暴露到外部的字段才是“可写的”。

因为变量 s 包含一个“可写的”反射对象，咱们能够修改结构体的字段：

f.Interface())s.Field(0).SetInt(77)
s.Field(1).SetString("Sunset Strip")
fmt.Println("t is now", t)

上面代码的输出以下：

t is now {77 Sunset Strip}

若是变量 s 是经过 t ，而不是 &t 建立的，调用 SetInt 和 SetString 将会失败，由于 t 的字段不是“可写的”。

结论

最后再次重复一遍反射三定律：

反射能够将“接口类型变量”转换为“反射类型对象”。
反射能够将“反射类型对象”转换为“接口类型变量”。
若是要修改“反射类型对象”，其值必须是“可写的”（settable）。

一旦你理解了这些定律，使用反射将会是一件很是简单的事情。它是一件强大的工具，使用时务必谨慎使用，更不要滥用。

关于反射，咱们还有不少内容没有讨论，包括基于管道的发送和接收、内存分配、使用slice和map、调用方法和函数，因为本文已经很是长了，这些话题在后续的文章中介绍。

原做者 Rob Pike，翻译Oscar