golang 并发安全Map以及分段锁的实现

时间 2019-11-07

标签 golang 并发安全 map 以及分段实现栏目 Go 繁體版

原文原文链接

涉及概念

并发安全Map
分段锁
sync.Map
CAS ( Compare And Swap )
双检查

分断锁

type SimpleCache struct {
    mu    sync.RWMutex
    items map[interface{}]*simpleItem
}

在平常开发中，上述这种数据结构确定很多见，由于golang的原生map是非并发安全的，因此为了保证map的并发安全，最简单的方式就是给map加锁。
以前使用过两个本地内存缓存的开源库， gcache, cache2go，其中存储缓存对象的结构都是这样，对于轻量级的缓存库，为了设计简洁（包含清理过时对象等 ) 再加上当须要缓存大量数据时有redis,memcache等明星项目解决。可是若是抛开这些因素遇到真正数量巨大的数据量时，直接对一个map加锁，当map中的值愈来愈多，访问map的请求愈来愈多，你们都竞争这一把锁显得并发访问控制变重。在go1.9引入sync.Map 以前，比较流行的作法就是使用分段锁，顾名思义就是将锁分段，将锁的粒度变小，将存储的对象分散到各个分片中，每一个分片由一把锁控制，这样使得当须要对在A分片上的数据进行读写时不会影响B分片的读写。
git

分段锁的实现

// Map 分片
type ConcurrentMap []*ConcurrentMapShared

// 每个Map 是一个加锁的并发安全Map
type ConcurrentMapShared struct {
    items map[string]interface{}
    sync.RWMutex    // 各个分片Map各自的锁
}

主流的分段锁，即经过hash取模的方式找到当前访问的key处于哪个分片之上，再对该分片进行加锁以后再读写。分片定位时，经常使用有BKDR, FNV32等hash算法获得key的hash值。github

func New() ConcurrentMap {
    // SHARD_COUNT  默认32个分片
    m := make(ConcurrentMap, SHARD_COUNT)
    for i := 0; i < SHARD_COUNT; i++ {
        m[i] = &ConcurrentMapShared{
            items: make(map[string]interface{}),
        }
    }
    return m
}

在初始化好分片后，对分片上的数据进行读写时就须要用hash取模进行分段定位来确认即将要读写的分片。golang

获取段定位

func (m ConcurrentMap) GetShard(key string) *ConcurrentMapShared {
    return m[uint(fnv32(key))%uint(SHARD_COUNT)]
}

// FNV hash
func fnv32(key string) uint32 {
    hash := uint32(2166136261)
    const prime32 = uint32(16777619)
    for i := 0; i < len(key); i++ {
        hash *= prime32
        hash ^= uint32(key[i])
    }
    return hash
}

以后对于map的GET SET 就简单顺利成章的完成redis

Set And Get

func (m ConcurrentMap) Set(key string, value interface{}) {
    shard := m.GetShard(key) // 段定位找到分片
    shard.Lock()              // 分片上锁
    shard.items[key] = value // 分片操做 
    shard.Unlock()              // 分片解锁
}

func (m ConcurrentMap) Get(key string) (interface{}, bool) {
    shard := m.GetShard(key)
    shard.RLock()
    val, ok := shard.items[key]
    shard.RUnlock()
    return val, ok
}

由此一个分段锁Map就实现了，可是比起普通的Map, 经常使用到的方法好比获取全部key, 获取全部Val 操做是要比原生Map复杂的，由于要遍历每个分片的每个数据，好在golang的并发特性使得解决这类问题变得很是简单算法

Keys

// 统计当前分段map中item的个数
func (m ConcurrentMap) Count() int {
    count := 0
    for i := 0; i < SHARD_COUNT; i++ {
        shard := m[i]
        shard.RLock()
        count += len(shard.items)
        shard.RUnlock()
    }
    return count
}

// 获取全部的key
func (m ConcurrentMap) Keys() []string {
    count := m.Count()
    ch := make(chan string, count)

    // 每个分片启动一个协程 遍历key
    go func() {
        wg := sync.WaitGroup{}
        wg.Add(SHARD_COUNT)
        for _, shard := range m {

            go func(shard *ConcurrentMapShared) {
                defer wg.Done()
                
                shard.RLock()

                // 每一个分片中的key遍历后都写入统计用的channel
                for key := range shard.items {
                    ch <- key
                }

                shard.RUnlock()
            }(shard)
        }
        wg.Wait()
        close(ch)
    }()

    keys := make([]string, count)
    // 统计各个协程并发读取Map分片的key
    for k := range ch {
        keys = append(keys, k)
    }
    return keys
}

这里写了一个benchMark来对该分段锁Map和原生的Map加锁方式进行压测，场景为将一万个不重复的键值对同时以100万次写和100万次读，分别进行5次压测，以下压测代码编程

func BenchmarkMapShared(b *testing.B) {
    num := 10000
    testCase := genNoRepetTestCase(num) // 10000个不重复的键值对
    m := New()
    for _, v := range testCase {
        m.Set(v.Key, v.Val)
    }
    b.ResetTimer()

    for i := 0; i < 5; i++ {
        b.Run(strconv.Itoa(i), func(b *testing.B) {

            b.N = 1000000

            wg := sync.WaitGroup{}
            wg.Add(b.N * 2)
            for i := 0; i < b.N; i++ {
                e := testCase[rand.Intn(num)]

                go func(key string, val interface{}) {
                    m.Set(key, val)
                    wg.Done()
                }(e.Key, e.Val)

                go func(key string) {
                    _, _ = m.Get(key)
                    wg.Done()
                }(e.Key)

            }
            wg.Wait()
        })
    }
}

原生Map加锁压测结果
缓存

分段锁压测结果
安全

能够看出在将锁的粒度细化后再面对大量须要控制并发安全的访问时，分段锁Map的耗时比原生Map加锁要快3倍有余数据结构

Sync.Map

go1.9以后加入了支持并发安全的Map sync.Map, sync.Map 经过一份只使用原子操做的数据和一份冗余了只读数据的加锁数据实现必定程度上的读写分离，使得大多数读操做和更新操做是原子操做，写入新数据才加锁的方式来提高性能。如下是 sync.Map源码剖析, 结构体中的注释都会在具体实现代码中提示相呼应多线程

type Map struct {
    // 保护dirty的锁
    mu Mutex                        
    // 只读数据（修改采用原子操做)
    read atomic.Value                
    // 包含只读中全部数据（冗余），写入新数据时也在dirty中操做
    dirty map[interface{}]*entry  
    // 当原子操做访问只读read时找不到数据时会去dirty中寻找，此时misses+1，dirty及做为存储新写入的数据，又冗余了只读结构中的数据，因此当misses > dirty 的长度时， 会将dirty升级为read，同时将老的dirty置nil
    misses int 
}

// Map struct 中的 read 就是readOnly 的指针
type readOnly struct {
    // 基础Map
    m   map[interface{}]*entry 
    // 用于表示当前dirty中是否有read中不存在的数据， 在写入数据时， 若是发现dirty中没有新数据且dirty为nil时，会将read中未被删除的数据拷贝一份冗余到dirty中， 过程与Map struct中的 misses相呼应
    amended bool 
}

// 数据项
type entry struct {
    p unsafe.Pointer 
}

// 用于标记数据项已被删除（主要保证数据冗余时的并发安全）
// 上述Map结构中说到有一个将read数据拷贝冗余至dirty的过程， 由于删除数据项是将*entry置nil, 为了不冗余过程当中因并发问题致使*entry改变而影响到拷贝后的dirty正确性，因此sync.Map使用expunged来标记entry是否被删除
var expunged = unsafe.Pointer(new(interface{}))

在下面sync.Map具体实现中将会看到不少“双检查”代码，由于经过原子操做获取的值可能在进行其余非原子操做过程当中已改变，因此再非原子操做后须要使用以前原子操做获取的值须要再次进行原子操做获取。

compareAndSwap 交换并比较，用于在多线程编程中实现不被打断的数据交换操做，从而避免多线程同时改写某一数据时致使数据不一致问题。

sync.Map Write

func (m *Map) Store(key, value interface{}) {
    // 先不上锁，而是从只读数据中按key读取， 若是已存在以compareAndSwap操做进行覆盖(update)
    read, _ := m.read.Load().(readOnly)
    if e, ok := read.m[key]; ok && e.tryStore(&value) {
        return
    }
    
    m.mu.Lock()
    // 双检查获取read
    read, _ = m.read.Load().(readOnly)
    // 若是data在read中，更新entry
    if e, ok := read.m[key]; ok {
        // 若是原子操做读到的数据是被标记删除的， 则视为新数据写入dirty
        if e.unexpungeLocked() {
            m.dirty[key] = e
        }
        // 原子操做写新数据
        e.storeLocked(&value)
    } else if e, ok := m.dirty[key]; ok {
        // 原子操做写新数据
        e.storeLocked(&value)
    } else {
        // 新数据 
        // 当dirty中没有新数据时，将read中数据冗余到dirty
        if !read.amended {
            m.dirtyLocked()
            m.read.Store(readOnly{m: read.m, amended: true})
        }
        
        m.dirty[key] = newEntry(value)
    }
    m.mu.Unlock()
}

func (e *entry) tryStore(i *interface{}) bool {
    p := atomic.LoadPointer(&e.p)
    if p == expunged {
        return false
    }
    for {
        if atomic.CompareAndSwapPointer(&e.p, p, unsafe.Pointer(i)) {
            return true
        }
        p = atomic.LoadPointer(&e.p)
        if p == expunged {
            return false
        }
    }
}


// 在dirty中没有比read多出的新数据时触发冗余
func (m *Map) dirtyLocked() {
    if m.dirty != nil {
        return
    }

    read, _ := m.read.Load().(readOnly)
    m.dirty = make(map[interface{}]*entry, len(read.m))
    for k, e := range read.m {
        // 检查entry是否被删除， 被删除的数据不冗余
        if !e.tryExpungeLocked() {
            m.dirty[k] = e
        }
    }
}

func (e *entry) tryExpungeLocked() (isExpunged bool) {
    p := atomic.LoadPointer(&e.p)
    for p == nil {
        // 将被删除（置nil）的数据以cas原子操做标记为expunged（防止因并发状况下其余操做致使冗余进dirty的数据不正确）
        if atomic.CompareAndSwapPointer(&e.p, nil, expunged) {
            return true
        }
        p = atomic.LoadPointer(&e.p)
    }
    return p == expunged
}

sync.Map Read

func (m *Map) Load(key interface{}) (value interface{}, ok bool) {
    read, _ := m.read.Load().(readOnly)
    e, ok := read.m[key]

    // 只读数据中没有，而且dirty有比read多的数据，加锁在dirty中找
    if !ok && read.amended {
        m.mu.Lock()
        // 双检查， 由于上锁以前的语句是非原子性的
        read, _ = m.read.Load().(readOnly)
        e, ok = read.m[key]
        if !ok && read.amended {
            // 只读中没有读取到的次数+1
            e, ok = m.dirty[key]
            // 检查是否达到触发dirty升级read的条件
            m.missLocked()
        }
        m.mu.Unlock()
    }
    if !ok {
        return nil, false
    }
    // atomic.Load 但被标记为删除的会返回nil
    return e.load()
}

func (m *Map) missLocked() {
    m.misses++
    if m.misses < len(m.dirty) {
        return
    }
    m.read.Store(readOnly{m: m.dirty})
    m.dirty = nil
    m.misses = 0
}

sync.Map DELETE

func (m *Map) Delete(key interface{}) {
    read, _ := m.read.Load().(readOnly)
    e, ok := read.m[key]
    // 只读中不存在须要到dirty中去删除
    if !ok && read.amended {
        m.mu.Lock() 
        // 双检查， 由于上锁以前的语句是非原子性的
        read, _ = m.read.Load().(readOnly)
        e, ok = read.m[key]
        if !ok && read.amended {
            delete(m.dirty, key)
        }
        m.mu.Unlock()
    }
    if ok {
        e.delete()
    }
}

func (e *entry) delete() (hadValue bool) {
    for {
        p := atomic.LoadPointer(&e.p)
        if p == nil || p == expunged {
            return false
        }
        if atomic.CompareAndSwapPointer(&e.p, p, nil) {
            return true
        }
    }
}

一样以刚刚压测原生加锁Map和分段锁的方式来压测sync.Map

压测平均下来sync.Map和分段锁差异不大，可是比起分段锁， sync.Map则将锁的粒度更加的细小到对数据的状态上，使得大多数据能够无锁化操做，同时比分段锁拥有更好的拓展性，由于分段锁使用前老是要定一个分片数量，在作扩容或者缩小时很麻烦, 但要达到sync.Map这种性能既好又能动态扩容的程度，代码就相对复杂不少。

还有注意在使用sync.Map时切忌不要将其拷贝， go源码中有对sync.Map注释到” A Map must not be copied after first use.”由于当sync.Map被拷贝以后， Map类型的dirty仍是那个map 可是read 和锁却不是以前的read和锁(都不在一个世界你拿什么保护我), 因此必然致使并发不安全（为了写博我把sync.Map代码复制出来一份把私有成员改为可外部访问的打印指针）