Golang的CSP很酷?其实.NET也能够轻松完成

提及Golang(后面统称为Go),就想到他的高并发特性,在深刻一些就是 Goroutine。在你们被它优雅的语法和简洁的代码实现的高并发程序所折服时,其实C#/.NET也能够很容易的作到。今天咱们来参照Go,来用C#实现它所采用的的CSP并发模型。html

CSP(Communicating sequential processes)

这东西我一开始觉得很简单,后面差了资料发现它独树一帜,本身是一门语言,也是一套理论。这边我不深刻的对它作过多的看法,我怕耽误你们=_=,你们能够看看wiki。算法

wiki:https://en.wikipedia.org/wiki/Communicating_sequential_processes编程

咱们从Go的角度对它进行一些分析,摘抄一段概要:多线程

“用于描述两个独立的并发实体经过共享的通信 channel(管道)进行通讯的并发模型。 CSP中channel是第一类对象,它不关注发送消息的实体,而关注与发送消息时使用的channel。”并发

好了,单独写出 CSP 是为了让你们了解这是一套独立于语言的东西,你们有兴趣能够查看wiki和搜索一些其它资料。异步

在Go中的CSP

Channel(通道)

Goroutine(不知道怎么翻译,你们能够理解成一个“工做者”,不是工做者线程。本质是实现了协程。)编程语言

协程(提高并发的利器)

你们都很明白线程能作什么,但协程是个什么东西?比起线程又如何呢?异步编程

线程

咱们从新思考一些东西。高并发

CPU:核心、超线程性能

OS:线程

编程语言:线程池

这边不作细讲,只是大概点到一下。

咱们所作的任何计算都要经由CPU计算,而CPU的核数直接决定了咱们能给CPU执行几件事情。

咱们如今所经常使用的OS内部都有一个轮询,用时间片的形式来分配任何轮流使用CPU执行计算,线程就是这些任务的载体。

这块的概念很是庞大(还有牵扯到,什么是并发,什么事并行),本文的重点不是这些,你们有兴趣后面能够单独开一篇文章来解释这块的内容。

回归本文,如今咱们知道线程是操做系统级别用来共享CPU的一种技术实现,多线程编程早在各大语言遍地开花,被用的唯妙唯肖,百花齐放。

那么为何须要协程呢?

线程的开销

这块又是一个大知识点,这边也很少作介绍。

你们只要明白,线程并非廉价的,一个线程的创立有至少两点的开销

  1. 内存
  2. 调度器压力(线程上下文切换等)

线程是能够持有逻辑数据的(好比,HttpContext.Current,等对象)因此一定是占用内存的(至于占用了多少内存不一样的语言和OS不同)

若是一个CPU是4核的,同时就只能处理4件任务,一个OS的线程越多他们轮训一整圈所耗的时间就更长。而每次调度线程时都须要复制当前线程上下文的状态,再去读取准备调度线程上下文的状态。

这边能够看到最后一点,有时候多线程反而会比单线程更加的慢,因此多线程提高性能本质上实际上是假的。多线程并不会提高程序性能。

我知道这边确定有人会心存疑问,绝大数的人都说用多线程来提高性能,为何这边说多线程会比单线程慢?

咱们这边想一下:PHP 和 NodeJS,PHP默认不支持多线程,NodeJS采用单线程事件轮询,他们的效率比拥有多线程的语言低吗?并不会。

多线程之因此快是由于做弊,别人一我的干的事情你叫两我的去干固然会比单线程快。这也有很是大的限制,多线程所执行的东西尽量避免共享,否则你的效率仍是可能不如单线程。

这边说的有点跑题,这块的内容实在太大,你们只要知道,线程即便不昂贵也毫不廉价。

针对这个问题,各大语言都推出了一个叫作线程池的技术,我申请一批线程,持有他,等到有任务的时候直接使用,这样我就不会频繁的建立和销毁线程了。这样大大提高了效率。

在.NET中,很早就提倡任何须要线程的时刻都使用 ThreadPool。

ps:如今觉大多数(我还没见过)的语言(runtime)中,线程与操做系统的线程是一一对应的。

回归协程

协程与线程是多对一的关系,有多个协程会对应到一根线程上。跟线程和CPU是同样的关系。

线程是为了共享CPU,而协程是为了共享线程。

协程是应用层面的自有“线程”实现。也就是说在不改变OS的线程逻辑下,本身构建了一套 “线程”系统。

为何不直接改动OS的线程,让其更轻?我我的以为 1是历史兼容性问题,2是必要性问题,线程是一个很好的抽象逻辑。实现协程彻底能够经过线程来完成。

协程的目的

咱们来思考一个场景

抓取百度、google、bing的html。

多线程的作法是

启动三个线程,分别对百度、google、bing发起HTTP GET请求。这时候使用了三个线程。

协程的作法是(极端)

启动一个线程对百度发起HTTP GET请求,将任务放入队列,在对google发起HTTP GET请求,将任务放入队列,在对bingHTTP GET请求将任务放入队列。

这时候只须要使用一个线程(极端状况下,其实大多数实现来讲至少须要两个线程,由于须要有一个后台线程去监放任务队列,当任务完成后再分配一个可用线程去处理下面的逻辑)

为何说极端状况下?由于协程有时候也可能会与线程一一对应,好比你的CPU有8个核心,同时跑4个协程也有可能会分配4根线程单独去处理这4个任务,这主要取决于调度算法。

总结:协程是为了提高线程利用率,减小线程的无用功(大多数是IO堵塞),协程也更适合IO密集型的场景。

C#中的协程

image

能够看到,3个任务是异步执行的,但都由线程4来处理,也就是说三个异步任务只用了一根线程。

C#中的CSP

讲了这么大篇幅的协程,终于回归了今天的主题。

其实单单实现CSP来讲根本不用理清线程和协程。但今天主要对比的是Go中的CSP,因此若是没有协程基本是没有意义的。

C#如何对应,CSP中最重要的Channel呢?

答案就是:BlockingCollection<T>

咱们来看一个例子

抓取一批网站并输出网站的title

发起 HTTP GET 请求 和分析Title的代码逻辑以下:

image

主程序的代码以下:

image

执行逻辑

  1. 启用一个生产者协程来根据url生产对应的html、同时使用主线程消费队列内的内容(异步)
  2. 每一个url单独起一个协程来发起HTTP GET请求
  3. 生产者协程等待全部url的html所有加载完成
  4. 标志队列完成
  5. 主线程退出

执行结果以下:

image

Go协程与.NET协程的区别?

去除实现上的一些逻辑,本质上没太多区别。

但Go有一个天生优点就是它是新时代的语言,抛弃了线程。也就是说Go层面没有线程的东西,它只有协程。

但.NET中线程已经拥有了好多年,大量的类库、驱动使用线程来完成。

因此你在上一层就算使用了协程,执行到底部不必定只有一根线程来完成,底部能够本身建立线程来运行逻辑,今天篇幅关系不作过多说明。后面咱们在介绍这块的内容。

写在最后

最后总结一个要点,多线程、协程并不能提高性能,它们所达到的目的只是提升CPU利用率。

今天原本想详细写BlockingCollection<T>的使用说明,但协程等概念占了大量的篇幅,后面咱们再来详细介绍.NET中的异步编程。

.NET技术栈QQ群:384413261(点击加入 .NET Group

相关文章
相关标签/搜索