在摩尔定律失效以前,提高处理器性能经过主频提高、硬件超线程等技术就能知足应用须要。随着主频提高慢慢接近撞上光速这道墙,摩尔定律开始逐渐失效,多核集成为处理器性能提高的主流手段。如今市面上已经很难看到单核的处理器,就是这一发展趋势的佐证。要充分发挥多核丰富的计算资源优点,多核下的并行编程就不可避免,Linux kernel就是一典型的多核并行编程场景。但多核下的并行编程却挑战多多。编程
目前主流的计算机都是冯诺依曼架构,即共享内存的计算模型,这种过程计算模型对并行计算并不友好。下图是一种典型的计算机硬件体系架构。数组
这种架构中,有以下设计特色:缓存
这些硬件体系设计特色也引入不少问题,最大的问题就是cache一致性问题和乱序执行问题。数据结构
cache一致性问题由cache一致性协议MESI解决,MESI由硬件保证,对软件来讲是透明的。MESI协议保证全部CPU对单个cache line中单个变量修改的顺序保持一致,但不保证不一样变量的修改在全部CPU上看到的是相同顺序。这就形成了乱序。不只如此,乱序的缘由还有不少:架构
这种状况形成,就连简单的++运算操做的原子性都没法保证。这些问题必须采用多核并行编程新的技术手段来解决。并发
Linux kernel提供了多种锁机制,如自旋锁、信号量、互斥量、读写锁、顺序锁等。各类锁的简单比较以下,具体实现和使用细节这里就不展开了,能够参考《Linux内核设计与实现》等书的相关章节。函数式编程
锁技术虽然能有效地提供并行执行下的竞态保护,但锁的并行可扩展性不好,没法充分发挥多核的性能优点。锁的粒度太粗会限制扩展性,粒度太细会致使巨大的系统开销,并且设计难度大,容易形成死锁。除了并发可扩展性差和死锁外,锁还会引入不少其余问题,如锁惊群、活锁、饥饿、不公平锁、优先级反转等。不过也有一些技术手段或指导原则能解决或减轻这些问题的风险。函数
原子技术主要是解决cache和内存不一致性和乱序执行对原子访问的破坏问题。Linux kernel中主要的原子原语有:性能
严格来讲,Linux kernel做为系统软件,实现受硬件影响很大,不一样硬件有不一样的内存模型,所以,不一样于高级语言,Linux kernel的原子原语语义并无一个统一模型。好比在SMP的ARM64 CPU上,barrier、smb_wmb、smb_rmb的实现与smb_mb都是同样的,都是volatile ("" ::: "memory")。优化
另外,再多提一句的是,atomic_inc()原语为了保证原子性,须要对cache进行刷新,而缓存行在多核体系下传播至关耗时,其多核下的并行可扩展性差。
上一小节中所提到的原子技术,是无锁技术中的一种,除此以外,无锁技术还包括RCU、Hazard pointer等。值得一提的是,这些无锁技术都基于内存屏障实现的。
不过,全部的无锁原语也只能解决读端的并行可扩展性问题,写端的并行可扩展性只能经过数据分割技术来解决。
分割数据结构,减小共享数据,是解决并行可扩展性的根本办法。对分割友好(即并行友好)的数据结构有:
使用这些便于分割的数据结构,有利于咱们经过数据分割来改善并行可扩展性。
除了使用合适的数据结构外,合理的分割指导规则也很重要:
4种分割规则中,全部权分割是分割最完全的。
以上这些多核并行编程内容基本上涵盖了Linux kernel中全部的并发编程关键技术。固然并行编程还有不少其余技术没有应用到Linux kernel中的,如无反作用的并行函数式编程技术(Erlang/Go等)、消息传递、MapReduce等等。