gf框架之grpool – 高性能的goroutine池

时间 2019-12-04

标签框架 grpool 高性能 goroutine 繁體版

原文原文链接

文章来源：http://gf.johng.cn/504458git

grpool

Go语言中的goroutine虽然相对于系统线程来讲比较轻量级，可是在高并发量下的goroutine频繁建立和销毁对于性能损耗以及GC来讲压力也不小。充分将goroutine复用，减小goroutine的建立/销毁的性能损耗，这即是grpool对goroutine进行池化封装的目的。例如，针对于100W个执行任务，使用goroutine的话须要不停建立并销毁100W个goroutine，而使用grpool也许底层只须要几千个goroutine便能充分复用地执行完成全部任务。经测试，在高并发下grpool的性能比原生的goroutine高出几倍到数百倍！而且随之也极大地下降了内存使用率。并发

性能测试报告：http://johng.cn/grpool-perfor...异步

方法列表

func Add(f func())
func Jobs() int
func SetExpire(expire int)
func SetSize(size int)
func Size() int
type Pool
    func New(expire int, sizes ...int) *Pool
    func (p *Pool) Add(f func())
    func (p *Pool) Close()
    func (p *Pool) Jobs() int
    func (p *Pool) SetExpire(expire int)
    func (p *Pool) SetSize(size int)
    func (p *Pool) Size() int

经过grpool.New方法建立一个goroutine池，并给定池中goroutine的有效时间，单位为秒，第二个参数为非必需参数，用于限定池中的工做goroutine数量，默认为不限制。须要注意的是，任务能够不停地往池中添加，没有限制，可是工做的goroutine是能够作限制的。咱们能够经过Size()方法查询当前的工做goroutine数量，使用Jobs()方法查询当前池中待处理的任务数量。函数

同时，池的大小和goroutine有效期能够经过SetSize和SetExpire方法在运行时进行动态改变。这一点特性使得协程池的管理更加灵活，可是也增长了必定的维护风险，由于你没法得知池的属性在哪一个地方被执行了修改。高并发

同时，为便于使用，grpool包提供了默认的goroutine池，直接经过grpool.Add便可往默认的池中添加任务，任务参数必须是一个 func() 类型的函数/方法。性能

使用示例

一、使用默认的goroutine池，限制10个工做goroutine执行1000个任务。测试

https://gitee.com/johng/gf/bl...线程

package main

import (
    "time"
    "fmt"
    "gitee.com/johng/gf/g/os/gtime"
    "gitee.com/johng/gf/g/os/grpool"
)

func job() {
    time.Sleep(1*time.Second)
}

func main() {
    grpool.SetSize(10)
    for i := 0; i < 1000; i++ {
        grpool.Add(job)
    }
    gtime.SetInterval(2*time.Second, func() bool {
        fmt.Println("size:", grpool.Size())
        fmt.Println("jobs:", grpool.Jobs())
        return true
    })
    select {}
}

这段程序中的任务函数的功能是sleep 1秒钟，这样便能充分展现出goroutine数量限制功能。其中，咱们使用了gtime.SetInterval定时器每隔2秒钟打印出当前默认池中的工做goroutine数量以及待处理的任务数量。code

二、咱们再来看一个新手常常容易出错的例子orm

https://gitee.com/johng/gf/bl...

package main

import (
    "fmt"
    "sync"
    "gitee.com/johng/gf/g/os/grpool"
)

func main() {
    wg := sync.WaitGroup{}
    for i := 0; i < 10; i++ {
        wg.Add(1)
        grpool.Add(func() {
            fmt.Println(i)
            wg.Done()
        })
    }
    wg.Wait()
}

咱们这段代码的目的是要顺序地打印出0-9，然而运行后却输出：

为何呢？这里的执行结果不管是采用go关键字来执行仍是grpool来执行都是如此。缘由是，对于异步线程/协程来说，函数进行进行异步执行注册时，该函数并未真正开始执行(注册时只在goroutine的栈中保存了变量i的内存地址)，而一旦开始执行时函数才会去读取变量i的值，而这个时候变量i的值已经自增到了10。
清楚缘由以后，改进方案也很简单了，就是在注册异步执行函数的时候，把当时变量i的值也一并传递获取；或者把当前变量i的值赋值给一个不会改变的临时变量，在函数中使用该临时变量而不是直接使用变量i。

改进后的示例代码以下：

1)、使用go关键字

https://gitee.com/johng/gf/bl...

package main

import (
    "fmt"
    "sync"
)

func main() {
    wg := sync.WaitGroup{}
    for i := 0; i < 10; i++ {
        wg.Add(1)
        go func(v int){
            fmt.Println(v)
            wg.Done()
        }(i)
    }
    wg.Wait()
}

执行后，输出结果为：

注意，异步执行时并不会保证按照函数注册时的顺序执行，如下同理。

2)、使用临时变量

https://gitee.com/johng/gf/bl...

package main

import (
    "fmt"
    "sync"
    "gitee.com/johng/gf/g/os/grpool"
)

func main() {
    wg := sync.WaitGroup{}
    for i := 0; i < 10; i++ {
        wg.Add(1)
        v := i
        grpool.Add(func() {
            fmt.Println(v)
            wg.Done()
        })
    }
    wg.Wait()
}

执行后，输出结果为：

这里能够看到，使用grpool进行任务注册时，只能使用func()类型的参数，所以没法在任务注册时把变量i的值注册进去，所以只能采用临时变量的形式来传递当前变量i的值。