高性能goroutine池---ants(2.5.0) 源码解析

最新推荐文章于 2024-11-15 21:58:23 发布

原创最新推荐文章于 2024-11-15 21:58:23 发布 · 826 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#golang #go #源码软件

引言

ants是一个高性能的 goroutine 池，实现了对大规模 goroutine 的调度管理、goroutine 复用，允许使用者在开发并发程序的时候限制 goroutine 数量，复用资源，达到更高效执行任务的效果。

本文将从头开始分析ants库是如何实现的,并在结尾给出性能测试结果.

ants库代码简洁,总代码量并不大,相信大家跟随此文可以较为轻松地了解如何设计一个简洁可用的goroutine池.

ants的功能(from 官方)

自动调度海量的 goroutines，复用 goroutines
定期清理过期的 goroutines，进一步节省资源
提供了大量有用的接口：任务提交、获取运行中的 goroutine 数量、动态调整 Pool 大小、释放 Pool、重启 Pool
优雅处理 panic，防止程序崩溃
资源复用，极大节省内存使用量；在大规模批量并发任务场景下比原生 goroutine 并发具有更高的性能
非阻塞机制

默认goroutine池

Ants会初始化一个默认的goroutine池,并且为其配备了各种函数.

var (
    //当处理器为单核,使用阻塞workerChan,多核则使用非阻塞workerChan
    //对于多核非阻塞workerChan可以有效提高效率,减少性能抖动
    workerChanCap = func() int {
        if runtime.GOMAXPROCS(0) == 1 {
            return 0
        }
        return 1
    }()

    defaultLogger = Logger(log.New(os.Stderr, "", log.LstdFlags))
    defaultAntsPool, _ = NewPool(DefaultAntsPoolSize)
)

// 向工作池提交任务
func Submit(task func()) error {
    return defaultAntsPool.Submit(task)
}

// 返回当前goroutine的并发数
func Running() int {
    return defaultAntsPool.Running()
}

// 返回默认池的容量
func Cap() int {
    return defaultAntsPool.Cap()
}
...

默认goroutine池由NewPool函数生成,接下来我们看看它是如何实现的.

Poll & NewPoll()

type Pool struct {
    capacity int32    //协程池容量
    running int32     //当前并发的协程数量
    lock sync.Locker  //用于保护工作队列的锁
    workers workerArray  //用于存放可用worker
    state int32       //用于提醒pool去关闭自己
    cond *sync.Cond   //用于等待获取可用worker的条件量
    workerCache sync.Pool  //用于在retrieveWorker函数中加速获取可用worker
    blockingNum int   //当前阻塞在pool.Submit过程的协程数量,其收到pool.lock保护
    options *Options  //协程池的配置信息
}

func NewPool(size int, options ...Option) (*Pool, error) {
    opts := loadOptions(options...)    //载入配置

    if size <= 0 {
        size = -1     //size为负数意味着协程池容量是无限的
    }

    if expiry := opts.ExpiryDuration; expiry < 0 {
        return nil, ErrInvalidPoolExpiry
    } else if expiry == 0 {
        opts.ExpiryDuration = DefaultCleanIntervalTime
    }

    if opts.Logger == nil {
        opts.Logger = defaultLogger
    }

    p := &Pool{
        capacity: int32(size),
        lock:     internal.NewSpinLock(),
        options:  opts,
    }
    p.workerCache.New = func() interface{} {     //初始化一个worker的缓存,用于加快worker的获取
        return &goWorker{
            pool: p,
            task: make(chan func(), workerChanCap),
        }
    }
    if p.options.PreAlloc {    //进行worker预分配
        if size == -1 {        //size为负数说明协程池容量是无限大,因此不可能进行预分配操作
            return nil, ErrInvalidPreAllocSize  
        }
        p.workers = newWorkerArray(loopQueueType, size)
    } else {
        p.workers = newWorkerArray(stackType, 0)
    }

    p.cond = sync.NewCond(p.lock)

    // 开启一个按时间间隔自动清理协程池的协程
    go p.purgePeriodically()

    return p, nil
}

按照上述流程,我们就得到了一个标准协程池.接下来我们看看如何使用协程池吧.

Poll配套方法

submit:向协程池发布任务

//注意:如果当前协程池没有可用worker,就会阻塞Pool.Submit()操作
//想要避免这一点就需要在实例化协程池的时候,将NonBlocking参数设为true
//这样的话可以在没有可用worker时直接返回nil
func (p *Pool) Submit(task func()) error {
    if p.IsClosed() {
        return ErrPoolClosed
    }
    var w *goWorker
    if w = p.retrieveWorker(); w == nil {
        return ErrPoolOverload
    }
    w.task <- task
    return nil
}

Cap & Running & IsClosed & Free & incRunning & decRunning:返回或更改协程池的元数据

func (p *Pool) Running() int {
    return int(atomic.LoadInt32(&p.running))
}

func (p *Pool) Cap() int {
    return int(atomic.LoadInt32(&p.capacity))
}

func (p *Pool) IsClosed() bool {
    return atomic.LoadInt32(&p.state) == CLOSED
}

func (p *Pool) Free() int { //返回可用空间大小
    c := p.Cap()
    if c < 0 {
        return -1
    }
    return c - p.Running()
}

func (p *Pool) incRunning() {
    atomic.AddInt32(&p.running, 1)
}

func (p *Pool) decRunning() {
    atomic.AddInt32(&p.running, -1)
}

retrieveWorker:获取一个可用的worker

func (p *Pool) retrieveWorker() (w *goWorker) {
    spawnWorker := func() {
        w = p.workerCache.Get().(*goWorker)
        w.run()
    }

    p.lock.Lock()

    w = p.workers.detach()
    if w != nil { // 首先尝试从协程池的worker队列中取一个可用的worker
        p.lock.Unlock()
    } else if capacity := p.Cap(); capacity == -1 || capacity > p.Running() {
        //如果worker队列是空的,但是还没有用完协程池的容量,就使用从workerCache获取一个worker
        p.lock.Unlock()
        spawnWorker()
    } else { //否则我们需要等待一个worker被放回到协程池中
        if p.options.Nonblocking {  //如果是非阻塞,则直接返回
            p.lock.Unlock()
            return
        }
    retry:  //如果当前协程池阻塞在submit上的数量大于允许的数量 则直接返回
        if p.options.MaxBlockingTasks != 0 && p.blockingNum >= p.options.MaxBlockingTasks {
            p.lock.Unlock()
            return
        }
        p.blockingNum++
        p.cond.Wait() //阻塞等待一个可用的worker
        p.blockingNum-- //被清道夫(scavenger)唤醒
        var nw int
        if nw = p.Running(); nw == 0 { 
            p.lock.Unlock()
            if !p.IsClosed() {
                spawnWorker()
            }
            return
        }
        if w = p.workers.detach(); w == nil { //再次尝试从worker队列中获取一个worker
            if nw < capacity {
                p.lock.Unlock()
                spawnWorker()
                return
            }
            goto retry    //到这里说明还是没有获取到可用的worker
        }

        p.lock.Unlock()
    }
    return
}

获取可用worker的流程如下:

首先尝试从worker队列中获取一个worker
如果worker队列为空则查看协程池容量是否足够,若足够则从workerCache中生成一个worker
如果协程池容量不足且协程池是非阻塞模式,则直接返回nil
如果协程池是阻塞模式,则先判断当前是否达到了允许的最大阻塞数量,若达到了则直接返回nil,

如果还未达到最大阻塞数量,则调用ool.cond.Wait()陷入阻塞状态
当被唤醒时,先查看当前运行中的worker数量,若为0则需要确认当前协程池状态,如果协程池关闭了就直接返回nil,

如果协程池未关闭,则从workerCache中生成一个worker
如果当前运行中的worker数量不为0,则重复上面的逻辑,先尝试获取worker队列中的worker,再根据协程池容量决定是否从workerCache中生成一个worker使用
如果还是没有获取到worker,则goto retry,进入下一轮阻塞-唤醒周期

Release & Reboot:释放/重启协程池

// 关闭协程池以及worker队列
func (p *Pool) Release() {
    atomic.StoreInt32(&p.state, CLOSED)
    p.lock.Lock()
    p.workers.reset()
    p.lock.Unlock()
    p.cond.Broadcast()    //有一些调用者阻塞在retrieveWorker中,为了避免它们被永久阻塞,我们需要唤醒他们
}

// 重启一个已经关闭的协程池
func (p *Pool) Reboot() {
    if atomic.CompareAndSwapInt32(&p.state, CLOSED, OPENED) {
        go p.purgePeriodically()
    }
}

Tune:动态调节协程池容量

// 调整协程池容量,注意:这对无限容量以及预分配空间的协程池是无效的
func (p *Pool) Tune(size int) {
    capacity := p.Cap()
    if capacity == -1 || size <= 0 || size == capacity || p.options.PreAlloc {
        return
    }
    atomic.StoreInt32(&p.capacity, int32(size))
    if size > capacity {
        if size-capacity == 1 {  //出于效率的考虑,如果只是扩容一个单位,那么不需要进行全局广播,只唤醒一个阻塞的协程即可
            p.cond.Signal()
            return
        }
        p.cond.Broadcast()
    }
}

purgePeriodically:作为一个清扫线程(scavenger)定期清理已过期的worker

func (p *Pool) purgePeriodically() {
    heartbeat := time.NewTicker(p.options.ExpiryDuration)
    defer heartbeat.Stop()

    for range heartbeat.C {
        if p.IsClosed() {
            break
        }

        p.lock.Lock()
        expiredWorkers := p.workers.retrieveExpiry(p.options.ExpiryDuration) //从worker列表中获取过期worker
        p.lock.Unlock()
        //通知过期worker停止工作
        //通知必须在p.lock锁的外部,因为worker.task可能是阻塞的channel,
        //因此如果在锁的内部而且很多worker位于非本地CPU上的时候就会花费大量的时间,
        //这样会干扰正常的协程池运行工作
        for i := range expiredWorkers {
            expiredWorkers[i].task <- nil
            expiredWorkers[i] = nil
        }
        //有一种情形:所有worker都被清扫了(即没有worker在运行),当一些调用者阻塞在pool.cond.Wait()中时
        //清扫线程需要唤醒他们
        if p.Running() == 0 {
            p.cond.Broadcast()
        }
    }
}

revertWorker:将worker放回到worker列表中回收利用

func (p *Pool) revertWorker(worker *goWorker) bool {
    if capacity := p.Cap(); (capacity > 0 && p.Running() > capacity) || p.IsClosed() {
        p.cond.Broadcast()
        return false
    }
    worker.recycleTime = time.Now() //更新被回收的时间
    p.lock.Lock()

    //为了避免内存泄露,需要在临界区内做双重检验(double check)
    if p.IsClosed() {
        p.lock.Unlock()
        return false
    }

    err := p.workers.insert(worker)
    if err != nil {
        p.lock.Unlock()
        return false
    }
    //通知陷入retrieveWorker调用阻塞的线程在worker列表中已经有可用的worker了
    p.cond.Signal()
    p.lock.Unlock()
    return true
}

---

## worker

```go
type goWorker struct {
  pool *Pool
  task chan func()
  recycleTime time.Time  //当被放回到worker队列时会更新
}

func (w *goWorker) run() { //运行worker
  w.pool.incRunning()
  go func() {
      defer func() {    //清理工作
          w.pool.decRunning()
          w.pool.workerCache.Put(w)
          if p := recover(); p != nil {    //panic处理
              if ph := w.pool.options.PanicHandler; ph != nil {
                  ph(p)
              } else {
                  w.pool.options.Logger.Printf("worker exits from a panic: %v\n", p)
                  var buf [4096]byte
                  n := runtime.Stack(buf[:], false)    //打印运行栈信息
                  w.pool.options.Logger.Printf("worker exits from panic: %s\n", string(buf[:n]))
              }
          }
          // 唤醒等待获取worker的协程
          w.pool.cond.Signal()
      }()

      for f := range w.task {    //循环获取任务并执行
          if f == nil {
              return
          }
          f()
          if ok := w.pool.revertWorker(w); !ok {
              return
          }
      }
  }()
}

worker_array

Ants库通过定义一个workerArray接口,实现了两种worker队列:loopQueue和Stack

type workerArray interface {
    len() int
    isEmpty() bool
    insert(worker *goWorker) error
    detach() *goWorker
    retrieveExpiry(duration time.Duration) []*goWorker
    reset()
}

type arrayType int

const (
    stackType arrayType = 1 << iota
    loopQueueType
)

func newWorkerArray(aType arrayType, size int) workerArray {
    switch aType {
    case stackType:
        return newWorkerStack(size)
    case loopQueueType:
        return newWorkerLoopQueue(size)
    default:
        return newWorkerStack(size)
    }
}

由于loopQueue和Stack队列原理基本一致,因此本文只剖析较为复杂的loopQueue

type loopQueue struct {    //循环队列.使用头尾指针和size定位
    items  []*goWorker
    expiry []*goWorker
    head   int
    tail   int
    size   int
    isFull bool
}

func newWorkerLoopQueue(size int) *loopQueue {
    return &loopQueue{
        items: make([]*goWorker, size),
        size:  size,
    }
}

func (wq *loopQueue) len() int {    //返回worker队列中worker个数
    if wq.size == 0 {
        return 0
    }
    if wq.head == wq.tail {
        if wq.isFull {
            return wq.size
        }
        return 0
    }
    if wq.tail > wq.head {    
        return wq.tail - wq.head
    }
    return wq.size - wq.head + wq.tail
}

func (wq *loopQueue) isEmpty() bool {
    return wq.head == wq.tail && !wq.isFull
}

func (wq *loopQueue) insert(worker *goWorker) error { //插入队列尾部
    ...
    wq.items[wq.tail] = worker
    wq.tail++

    if wq.tail == wq.size {    //尾部越界了,将其指向队列头部
        wq.tail = 0
    }
    if wq.tail == wq.head {    //记得处理队列满的情况
        wq.isFull = true
    }

    return nil
}

func (wq *loopQueue) detach() *goWorker {    //从队列头取一个worker
    if wq.isEmpty() {
        return nil
    }

    w := wq.items[wq.head]
    wq.items[wq.head] = nil
    wq.head++
    if wq.head == wq.size {    //同上 越界时将其指向队列头部
        wq.head = 0
    }
    wq.isFull = false    //更新队列状态

    return w
}

func (wq *loopQueue) retrieveExpiry(duration time.Duration) []*goWorker { //获取过期的worker列表
    expiryTime := time.Now().Add(-duration)
    index := wq.binarySearch(expiryTime)    //折半查找最近的过期worker
    if index == -1 {
        return nil
    }
    wq.expiry = wq.expiry[:0]

    if wq.head <= index {    //说明此时head < tail
        wq.expiry = append(wq.expiry, wq.items[wq.head:index+1]...)
        for i := wq.head; i < index+1; i++ {    
            wq.items[i] = nil
        }
    } else {    //此时head > tail 需要将两部分expiry都添加进过期列表
        wq.expiry = append(wq.expiry, wq.items[0:index+1]...)
        wq.expiry = append(wq.expiry, wq.items[wq.head:]...)
        for i := 0; i < index+1; i++ {
            wq.items[i] = nil
        }
        for i := wq.head; i < wq.size; i++ {
            wq.items[i] = nil
        }
    }
    head := (index + 1) % wq.size    //找到新head的位置
    wq.head = head
    if len(wq.expiry) > 0 {
        wq.isFull = false
    }

    return wq.expiry
}

func (wq *loopQueue) binarySearch(expiryTime time.Time) int {
    var mid, nlen, basel, tmid int
    nlen = len(wq.items)

    // 如果worker队列已经为空/队列头还未到失效时间,则直接返回-1
    if wq.isEmpty() || expiryTime.Before(wq.items[wq.head].recycleTime) {
        return -1
    }
    //在worker_stack的算法基础上将head和tail映射到left和right
    r := (wq.tail - 1 - wq.head + nlen) % nlen
    basel = wq.head
    l := 0
    for l <= r {
        mid = l + ((r - l) >> 1)
        // 根据映射的mid计算真正的mid
        tmid = (mid + basel + nlen) % nlen
        if expiryTime.Before(wq.items[tmid].recycleTime) {
            r = mid - 1
        } else {
            l = mid + 1
        }
    }
    // 根据映射索引返回真正的索引
    return (r + basel + nlen) % nlen
}

func (wq *loopQueue) reset() {    //重置队列
    if wq.isEmpty() {
        return
    }

Releasing:
    if w := wq.detach(); w != nil {
        w.task <- nil
        goto Releasing
    }
    wq.items = wq.items[:0]
    wq.size = 0
    wq.head = 0
    wq.tail = 0
}

更纯粹的pool---PoolWithFunc

有时候我们只需要协程池做一件事,这时我们可以使用PoolWithFunc,将工作函数与协程池绑定以获得更好的性能.

PoolWithFunc结构体

type PoolWithFunc struct {
    capacity int32
    running int32
    lock sync.Locker
    workers []*goWorkerWithFunc
    state int32
    cond *sync.Cond
    poolFunc func(interface{})    //存储协程池绑定的函数
    workerCache sync.Pool
    blockingNum int
    options *Options
}

与普通协程池不同的是,PoolWithFunc使用切片来管理空闲的worker.并且由于和工作函数绑定,每个worker都执行相同的任务

func (p *PoolWithFunc) Invoke(args interface{}) error {
    if p.IsClosed() {
        return ErrPoolClosed
    }
    var w *goWorkerWithFunc
    if w = p.retrieveWorker(); w == nil {
        return ErrPoolOverload
    }
    w.args <- args
    return nil
}

向PoolWithFunc发布任务只需要调用Invoke,传入参数包即可.

goWorkerWithFunc结构体

type goWorkerWithFunc struct {
    pool *PoolWithFunc
    args chan interface{}
    recycleTime time.Time
}

与普通worker相比,goWorkerWithFunc只有args Channel用于接受参数包,然后执行工作函数,其run方法与普通worker基本一致.

func (w *goWorkerWithFunc) run() {
    w.pool.incRunning()
    go func() {
        defer func() {
            ...
            w.pool.cond.Signal()
        }()

        for args := range w.args {
            if args == nil {
                return
            }
            w.pool.poolFunc(args)
            if ok := w.pool.revertWorker(w); !ok {
                return
            }
        }
    }()
}

性能测试

我运行了一下官方的基准测试,发现使用ants库以后,内存耗费明显减少了,如果使用PoolWithFunc则可以进一步减少内存消耗.可以见得ants库在大量并发的情况下能大大减少内存占用.

goos: linux
goarch: amd64
pkg: github.com/panjf2000/ants/v2
cpu: Intel(R) Xeon(R) Platinum 8269CY CPU @ 2.50GHz
BenchmarkGoroutines-2                 10         124269653 ns/op         9002868 B/op     102309 allocs/op
BenchmarkAntsPool-2                    9         114329539 ns/op         2376181 B/op     110609 allocs/op
BenchmarkAntsPoolWithFunc-2            9         111820051 ns/op          795664 B/op      10627 allocs/op
PASS
ok      github.com/panjf2000/ants/v2    83.012s


goos: linux
goarch: amd64
pkg: github.com/panjf2000/ants/v2
cpu: Intel(R) Xeon(R) Platinum 8269CY CPU @ 2.50GHz
BenchmarkGoroutines-2                  9         116295918 ns/op         8101271 B/op     101055 allocs/op
BenchmarkAntsPool-2                    9         125107370 ns/op         2351351 B/op     110351 allocs/op
BenchmarkAntsPoolWithFunc-2            9         116057004 ns/op          783399 B/op      10499 allocs/op
PASS
ok      github.com/panjf2000/ants/v2    85.388s