在阿里云PHP技术沙龙专场中,阿里云邀请到php-nsq做者,pecl、Swoole开发组成员吴振宇分享了Swoole进程模型的原理与Swoole协程实现的原理。并结合具体开发案例讲解了Swoole在网络编程中的应用。php
本次直播视频精彩回顾,戳这里!
直播回顾:https://yq.aliyun.com/live/965
PPT分享:https://yq.aliyun.com/download/3528编程
如下内容根据演讲嘉宾视频分享以及PPT整理而成。数组
网络编程又可称为Socket编程。编程分为基于Server端开发与基于Client端开发两部分。基于Server端的编程由四大步骤组成,开发者首先建立Socket,利用bind与listen函数绑定监听地址及相应的端口,最后使用accept函数接受来自监听端的请求。Client端的操做较为简便,开发者在建立Socket后使用connect函数对服务器端进行链接便可实现。
下图所示为Client端与Server端的协做示意图。Client端首先向Server端发起带有SYN标识的握手请求,Server端接受到请求后,返回给Client端带有SYN与ACK标识的请求并将Client端中的RCVD文件加载至队列中,在三次握手完成以后,该文件描述符将被添加至accept队列中等待下一步逻辑处理。缓存
下图所示为Socket编程的实现代码服务器
在Socket编程中,Socket的读写状态判断十分重要。Socket可读条件分为如下四条:网络
对应于Socket可读条件的判断,Socket可写条件也分为如下四条:数据结构
在一款应用开发初期,应用的用户很少,服务器相对的要求一样不高,此时开发者可使用多进程策略进行应用的开发,以此加快开发效率。下图所示为多进程同步阻塞开发的伪代码。架构
当业务量扩大,系统须要进行优化时,开发者能够对每一个子进程中的套接字进行监听,其伪代码以下图所示。异步
当系统的用户及业务量扩大到必定规模时,开发者可使用多路IO复用、Reactor及异步非阻塞等方法对系统进行改进。以下图所示,在这些系统调用中,Select方法存在内存开销大,支持文件描述符数量少的缺点。目前Epoll系统调用方式占据开发的主流位置,Epoll方式采用了红黑树的数据结构模式,同时拥有就绪列表rdlist,当套接字中存在可读或可写的事件时,该事件将被直接添加到就绪列表当中,从而使系统省去了轮询全部套接字属性的过程,提升了系统的执行效率。函数
操做系统进程调用时分为正在运行,阻塞运行及等待运行三个状态。在处理进程的过程当中,内核会不断发生中断,好比三次握手过程当中,当ACK发送时,内核会触发中断,系统此时须要放下正在执行的任务,去处理TCP的任务。处理完成后,系统结束中断处理并恢复运行被打断的进程。下图所示为操做系统进程调度的一些方法。
在三次握手中,系统执行如下三个步骤完成操做系统的调度:
1.网卡收到数据:网卡收到SYN消息,触发内核中断,系统将直接打断当前执行的进程,同时CPU将会把套接字加入到Socket Queue队列当中进行存储。
2.中断回调:若当前没有新的链接,accept将阻塞到系统调用上,并将套接字注册到Wait Queue上。
3.系统中断回调:当新的链接产生时,Wait Queue队列将触发回调函数,将相应数据加载至rdlist列表中。
若网卡收到ACK消息,则继续触发内核中断,内核完成标准的三次握手,将链接从半链接队列移入链接队列,因而 listen Socket有可读事件,内核调用listen Socket的Wait Queue的唤醒回调函数,将以前阻塞的accept进程置为 Ready调度状态。
Epoll主要用来监听Socket的可读可写过程,在Epoll建立时,开发者须要传对应文件描述符EPOLLIN与EPOLLOUT做为可读与可写的参数标志,epoll_wait函数拥有accept的功能,会在事件发送后提醒开发者。下图罗列了Epoll中的参数与主要方法。
将Socket建立与accept过程转化为Epoll的代码示意图以下所示。首先将fd做为描述符加入建立好的Epoll中,同时把开发者想要监听的可读可写事件也注册入Epoll之中。当listen fd监听到事件时,使用accept方法将该fd描述符设为可读事件,并再次将其加入到Epoll的监听数组中,此时表明真正的客户端链接已接入。
Reactor模型的建立与使用较为简单,其中含有如下四个方法:
在进程模式中,系统采用MainReactor线程监听accept,线程将出现的问题抛给Worker进程进行处理,这样即便单个Worker进程挂掉也不会对系统产生任何的影响。下图所示为进程模式的系统结构示意图。
下图展现了对Swoole模式的调用代码示意。在用户使用客户端去链接服务器的过程当中,系统首先注册可读可写与超时三个状态回调函数。客户端与服务器链接成功时,套接字变为可写状态,系统调用可写状态的回调函数,在回调函数中处理相关的数据。
Swoole协程是由事件驱动与栈切换两步共同实现完成的。
在C语言环境中,事件的调用每每使用堆栈进行处理。在堆栈中,指针EBP指向堆栈栈底,指针ESP指向堆栈栈顶,在函数调用以后,每一个EBP的返回值会返回上一个EBP的地址。以此来进行事件调用的检索。下图所示为C语言中的事件调用示意图。
在PHP中的函数调用步骤以下图所示。PHP首先经过词法分析与语法分析将代码编译成语法树,语法树中的每个语法会被编译入opcode,语法中的每个函数会以oparray的形式存入结构体EG中,EG结构体使用函数表对这些函数进行存储。
当函数调用时,结构体中的call对应指针ESP,prev对应于指针EBP。当用户调取函数时,系统会向zend VM中为每个方法申请一个堆栈的内存。当系统中一个函数调用其余函数时,会调用code下方储存的地址,调用方法的opcode从function存储的成员中找到并进行编译与执行。当触发了opcode后,系统会申请一个新的内存来进行新的内存分配。下图为PHP调用示意图。
下图所示为在PHP函数调用中压栈的过程及函数中存在的opcode。FCALL与DO_FCALL负责函数的调用,当堆栈中第一个opcode执行时,将进行参数压栈的操做。触发函数调用时,将执行DO_FCALL操做,系统将会把下一个函数的调用地址压入堆栈。当调用有结果后系统会将返回值返回入CALL FRAME中。
下图所示为Swoole协程代码。协程代码包括两个执行网络IO操做的go函数,当系统执行connect操做时触发网络IO操做,并将当前的PHP调用栈先保存起来。在当前调用栈保存好后,系统顺次执行下面的函数调用。当connect遇到IO函数时,系统会跳出当前任务去执行堆栈中储存的任务。
在Swoole2.0中使用C函数进行线程任务的协程。当开发者调用setjmp时,函数的返回值为0并调起first函数。当调用longjmp时,setjmp也一样被调起,此时返回值为1。Swoole2.0利用该代码实现了PHP执行的跳转,代码示意图以下。
Swoole2.0协程时序图与代码展现以下图所示。setjump方法设置当前函数堆栈,当有网络事件产生时,系统将首先对产生的事件进行注册,并在有事件通知时跳回执行中的代码,以此完成代码协程过程。
Swoole4.0经过实现C堆栈对Swoole2.0中的问题进行了改进。在Swoole4.0中用户直接调用MySQL中的连接直接就能够造成网络协程。下图所示为Swoole4.0内核系统架构示意图。
Swoole4.0的时序调度与Swoole2.0差异不大,不一样的是Swoole4.0使用汇编指令对C栈与堆栈进行了存储。在协程建立时,系统会产生C栈与PHP栈,两个堆栈间会进行通讯,经过这种方法解决了C栈销毁后的一些问题。下图展示了Swoole4.0的时序图。
当系统连接数量增多后会出现一些问题,开发者经过设置心跳参数与心跳收回能够保证系统服务器的资源不会被浪费。下图列举了Swoole网络编程对系统进行优化的方式。
下图为吴老师分享的内容的关键词总结。
原文连接 本文为云栖社区原创内容,未经容许不得转载。