gf框架之grpool – 高性能的goroutine池

时间 2019-12-10

标签框架 grpool 高性能 goroutine 繁體版

原文原文链接

Go语言中的goroutine虽然相对于系统线程来讲比较轻量级，可是在高并发量下的goroutine频繁建立和销毁对于性能损耗以及GC来讲压力也不小。充分将goroutine复用，减小goroutine的建立/销毁的性能损耗，这即是grpool对goroutine进行池化封装的目的。例如，针对于100W个执行任务，使用goroutine的话须要不停建立并销毁100W个goroutine，而使用grpool也许底层只须要几千个goroutine便能充分复用地执行完成全部任务。经测试，在高并发下grpool的性能比原生的goroutine高出几倍到数百倍！而且随之也极大地下降了内存使用率。git

性能测试报告：johng.cn/grpool-perf…segmentfault

方法列表

func Add(f func())
func Jobs() int
func SetExpire(expire int)
func SetSize(size int)
func Size() int
type Pool
    func New(expire int, sizes ...int) *Pool
    func (p *Pool) Add(f func())
    func (p *Pool) Close()
    func (p *Pool) Jobs() int
    func (p *Pool) SetExpire(expire int)
    func (p *Pool) SetSize(size int)
    func (p *Pool) Size() int

经过grpool.New方法建立一个goroutine池，并给定池中goroutine的有效时间，单位为秒，第二个参数为非必需参数，用于限定池中的工做goroutine数量，默认为不限制。须要注意的是，任务能够不停地往池中添加，没有限制，可是工做的goroutine是能够作限制的。咱们能够经过Size()方法查询当前的工做goroutine数量，使用Jobs()方法查询当前池中待处理的任务数量。同时，池的大小和goroutine有效期能够经过SetSize和SetExpire方法在运行时进行动态改变。并发

同时，为便于使用，grpool包提供了默认的goroutine池，直接经过grpool.Add便可往默认的池中添加任务，任务参数必须是一个func() 类型的函数/方法。异步

使用示例

一、使用默认的goroutine池，限制10个工做goroutine执行1000个任务。函数

gitee.com/johng/gf/bl…高并发

package main
 
import (
    "time"
    "fmt"
    "gitee.com/johng/gf/g/os/gtime"
    "gitee.com/johng/gf/g/os/grpool"
)
func job() {
    time.Sleep(1*time.Second)
}
func main() {
    grpool.SetSize(10)
    for i := 0; i < 1000; i++ {
        grpool.Add(job)
    }
    gtime.SetInterval(2*time.Second, func() bool {
        fmt.Println("size:", grpool.Size())
        fmt.Println("jobs:", grpool.Jobs())
        return true
    })
    select {}
}

这段程序中的任务函数的功能是sleep 1秒钟，这样便能充分展现出goroutine数量限制功能。其中，咱们使用了gtime.SetInterval定时器每隔2秒钟打印出当前默认池中的工做goroutine数量以及待处理的任务数量。性能

二、咱们再来看一个新手常常容易出错的例子测试

gitee.com/johng/gf/bl…ui

package main
 
import (
    "fmt"
    "sync"
    "gitee.com/johng/gf/g/os/grpool"
)
func main() {
    wg := sync.WaitGroup{}
    for i := 0; i < 10; i++ {
        wg.Add(1)
        grpool.Add(func() {
            fmt.Println(i)
            wg.Done()
        })
    }
    wg.Wait()
}

咱们这段代码的目的是要顺序地打印出0-9，然而运行后却输出：spa

为何呢？这里的执行结果不管是采用go关键字来执行仍是grpool来执行都是如此。缘由是，对于异步线程/协程来说，函数进行进行异步执行注册时，该函数并未真正开始执行(注册时只在goroutine的栈中保存了变量i的内存地址)，而一旦开始执行时函数才会去读取变量i的值，而这个时候变量i的值已经自增到了10。清楚缘由以后，改进方案也很简单了，就是在注册异步执行函数的时候，把当时变量i的值也一并传递获取；或者把当前变量i的值赋值给一个不会改变的临时变量，在函数中使用该临时变量而不是直接使用变量i。

改进后的示例代码以下：

1)、使用go关键字

gitee.com/johng/gf/bl…

package main
 
import (
    "fmt"
    "sync"
)
func main() {
    wg := sync.WaitGroup{}
    for i := 0; i < 10; i++ {
        wg.Add(1)
        go func(v int){
            fmt.Println(v)
            wg.Done()
        }(i)
    }
    wg.Wait()
}

执行后，输出结果为：

注意，异步执行时并不会保证按照函数注册时的顺序执行，如下同理。

2)、使用临时变量

gitee.com/johng/gf/bl…

package main
 
import (
    "fmt"
    "sync"
    "gitee.com/johng/gf/g/os/grpool"
)
func main() {
    wg := sync.WaitGroup{}
    for i := 0; i < 10; i++ {
        wg.Add(1)
        v := i
        grpool.Add(func() {
            fmt.Println(v)
            wg.Done()
        })
    }
    wg.Wait()
}

执行后，输出结果为：

这里能够看到，使用grpool进行任务注册时，只能使用func()类型的参数，所以没法在任务注册时把变量i的值注册进去，所以只能采用临时变量的形式来传递当前变量i的值。

https://segmentfault.com/q/1010000013455064

首先, 我以为要不要限制 goroutine 数量得看瓶颈或关键问题点.

其次, 全局单例 Grpool 颇有问题, 如下是 sync.WaitGroup 官方文档

func (wg *WaitGroup) Add(delta int)

Add adds delta, which may be negative, to the WaitGroup counter.
If the counter becomes zero, all goroutines blocked on Wait are released.
If the counter goes negative, Add panics.

这意味着时间相近的多个请求和可能会绑在一块儿, 变成多个 pool.Wait() 同时返回.

如下是资源池的简单示例, 但愿有益

package main

type Pool struct {
    q chan int
}

func NewPool(max_size int) *Pool {
    return &Pool{q: make(chan int, max_size)}
}

func (p *Pool) Acquire() {
    p.q <- 1
}

func (p *Pool) Release() {
    <-p.q
}

func main() {
    p := NewPool(10)
    p.Acquire()
    // ...
    p.Release()
}