有点不安全却又一亮的 Go unsafe.Pointer

在上一篇文章 《深刻理解 Go Slice》 中,你们会发现其底层数据结构使用了 unsafe.Pointer。所以想着再介绍一下其关联知识git

原文地址:有点不安全却又一亮的 Go unsafe.Pointergithub

前言

在你们学习 Go 的时候,确定都学过 “Go 的指针是不支持指针运算和转换” 这个知识点。为何呢?golang

首先,Go 是一门静态语言,全部的变量都必须为标量类型。不一样的类型不可以进行赋值、计算等跨类型的操做。那么指针也对应着相对的类型,也在 Compile 的静态类型检查的范围内。同时静态语言,也称为强类型。也就是一旦定义了,就不能再改变它segmentfault

错误示例

func main(){
    num := 5
    numPointer := &num

    flnum := (*float32)(numPointer)
    fmt.Println(flnum)
}

输出结果:安全

# command-line-arguments
...: cannot convert numPointer (type *int) to type *float32

在示例中,咱们建立了一个 num 变量,值为 5,类型为 int。取了其对于的指针地址后,试图强制转换为 *float32,结果失败...数据结构

unsafe

针对刚刚的 “错误示例”,咱们能够采用今天的男主角 unsafe 标准库来解决。它是一个神奇的包,在官方的诠释中,有以下概述:学习

  • 围绕 Go 程序内存安全及类型的操做
  • 极可能会是不可移植的
  • 不受 Go 1 兼容性指南的保护

简单来说就是,不怎么推荐你使用。由于它是 unsafe(不安全的),可是在特殊的场景下,使用了它。能够打破 Go 的类型和内存安全机制,让你得到眼前一亮的惊喜效果 😄ui

Pointer

为了解决这个问题,须要用到 unsafe.Pointer。它表示任意类型且可寻址的指针值,能够在不一样的指针类型之间进行转换(相似 C 语言的 void * 的用途)指针

其包含四种核心操做:code

  • 任何类型的指针值均可以转换为 Pointer
  • Pointer 能够转换为任何类型的指针值
  • uintptr 能够转换为 Pointer
  • Pointer 能够转换为 uintptr

在这一部分,重点看第一点、第二点。你再想一想怎么修改 “错误示例” 让它运行起来?

func main(){
    num := 5
    numPointer := &num

    flnum := (*float32)(unsafe.Pointer(numPointer))
    fmt.Println(flnum)
}

输出结果:

0xc4200140b0

在上述代码中,咱们小加改动。经过 unsafe.Pointer 的特性对该指针变量进行了修改,就能够完成任意类型(*T)的指针转换

须要注意的是,这时还没法对变量进行操做或访问。由于不知道该指针地址指向的东西具体是什么类型。不知道是什么类型,又如何进行解析呢。没法解析也就天然没法对其变动了

Offsetof

在上小节中,咱们对普通的指针变量进行了修改。那么它是否能作更复杂一点的事呢?

type Num struct{
    i string
    j int64
}

func main(){
    n := Num{i: "EDDYCJY", j: 1}
    nPointer := unsafe.Pointer(&n)

    niPointer := (*string)(unsafe.Pointer(nPointer))
    *niPointer = "煎鱼"

    njPointer := (*int64)(unsafe.Pointer(uintptr(nPointer) + unsafe.Offsetof(n.j)))
    *njPointer = 2

    fmt.Printf("n.i: %s, n.j: %d", n.i, n.j)
}

输出结果:

n.i: 煎鱼, n.j: 2

在剖析这段代码作了什么事以前,咱们须要了解结构体的一些基本概念:

  • 结构体的成员变量在内存存储上是一段连续的内存
  • 结构体的初始地址就是第一个成员变量的内存地址
  • 基于结构体的成员地址去计算偏移量。就可以得出其余成员变量的内存地址

再回来看看上述代码,得出执行流程:

  • 修改 n.i 值:i 为第一个成员变量。所以不须要进行偏移量计算,直接取出指针后转换为 Pointer,再强制转换为字符串类型的指针值便可
  • 修改 n.j 值:j 为第二个成员变量。须要进行偏移量计算,才能够对其内存地址进行修改。在进行了偏移运算后,当前地址已经指向第二个成员变量。接着重复转换赋值便可

须要注意的是,这里使用了以下方法(来完成偏移计算的目标):

一、uintptr:uintptr 是 Go 的内置类型。返回无符号整数,可存储一个完整的地址。后续经常使用于指针运算

type uintptr uintptr

二、unsafe.Offsetof:返回成员变量 x 在结构体当中的偏移量。更具体的讲,就是返回结构体初始位置到 x 之间的字节数。须要注意的是入参 ArbitraryType 表示任意类型,并不是定义的 int。它实际做用是一个占位符

func Offsetof(x ArbitraryType) uintptr

在这一部分,其实就是巧用了 Pointer 的第3、第四点特性。这时候就已经能够对变量进行操做了 😄

错误示例

func main(){
    n := Num{i: "EDDYCJY", j: 1}
    nPointer := unsafe.Pointer(&n)
    ...

    ptr := uintptr(nPointer)
    njPointer := (*int64)(unsafe.Pointer(ptr + unsafe.Offsetof(n.j)))
    ...
}

这里存在一个问题,uintptr 类型是不能存储在临时变量中的。由于从 GC 的角度来看,uintptr 类型的临时变量只是一个无符号整数,并不知道它是一个指针地址

所以当知足必定条件后,ptr 这个临时变量是可能被垃圾回收掉的,那么接下来的内存操做,岂不成迷?

总结

简洁回顾两个知识点。第一是 unsafe.Pointer 可让你的变量在不一样的指针类型转来转去,也就是表示为任意可寻址的指针类型。第二是 uintptr 经常使用于与 unsafe.Pointer 打配合,用于作指针运算,巧妙地很

最后仍是那句,没有特殊必要的话。是不建议使用 unsafe 标准库,它并不安全。虽然它经常能让你眼前一亮 👌

相关文章
相关标签/搜索