网络编程与并发编程汇总

时间 2019-11-13
原文原文链接
软件开发架构:

C/S:
    Client: 客户端
    Server: 服务端

    优势:
        占用网络资源少,软件的使用稳定

    缺点:
        服务端更新后,客户端也得跟着跟新.
        须要使用多个软件,须要下载多个客户端

B/S:
    Browser: 浏览器(客户端)
    Server: 服务端

服务端与客户端做用:
    服务端: 24小时不间断提供服务
    客户端: 须要体验服务端时,再去链接服务端,并享受服务

一 网络编程:
1.互联网协议OSI七层协议
    1)应用层
    2)表示层
    3)会话层
    4)传输层
    5)网络层
    6)数据链路层
    7)物理链接层

    - 物理链接层
        基于电信号发送二进制数据.

    - 数据链路层
        1) 规定好电信号的分组方式
        2) 必需要有一块网卡:
            - mac地址:
                12位惟一的16进制字符串
                    - 前6位: 厂商号
                    - 后6位: 流水号
        - 以太网协议:
            在同一个局域网内通讯.
            - 单播
                1对1吼
            - 广播
                多对多吼
                - 广播风暴:
                - 不能跨局域网通讯

    - 网络层
        - ip: 定位局域网的位置
        - port: 惟一标识一台计算机上一个应用程序.
        - arp协议:
            将mac地址获取,并解析成ip和port.

    - 传输层
        - TCP
            特色:
                TCP协议称之为流式协议.

            若想要通讯,必须创建链接,并创建双向通道.
            - 三次握手,四次挥手
                - 三次握手建链接
                    - 客户端往服务端发送请求创建通道
                    - 服务端要确认客户端的请求,并往客户端也发送请求创建通道
                    - 客户端接收到服务端创建链接的请求,并返回确认
                    - 创建双向通道

                - 双向通道:
                    - 反馈机制
                    客户端往服务端发送请求获取数据,服务端务必返回数据,客户端确认收到.
                    反则会反复发送,一直到某个时间段内,会中止发送

                - 四次挥手断链接
                    - C往S发送断开链接请求,S返回确认收到
                    - S须要再次发送断开链接请求
                    - C返回确认收到
                    - 最终确认断开链接

        - UDP
            1)数据不安全
            2)不须要创建双向通道
            3)传输速度快
            4)不会有粘包问题
            5)客户端发送数据,不须要服务端确认收到,爱收不收

        TCP与UPD的区别:
            TCP: 比喻成在打电话
            UDP: 比喻成发送短信

    - 应用层
        - ftp
        - http:
            能够携带一堆数据

        - http + ssl

2.socket
    socket用来写套接字客户端与服务端的模块,内部帮咱们封装好了7层协议须要作的事情.

3.手撸socket套接字模板
    - 服务端:
        import socket
        server = socket.socket()
        server.bind(
            (ip, port)
        )  # 绑定手机号
        server.listen(6)  # 半链接池: 能够接待7个客户端
        # 监听链接
        conn, addr =server.accept()
        # 接收消息
        data = conn.recv(1024)
        # 发送消息
        conn.send('消息内容'.encode('utf-8'))

    - 客户端:
        import socket
        client = socket.socket()
        client.connect(
            (ip, port)
        )
        # 发送消息
        client.send()
        # 接收消息
        client.recv(1024)

4.subprocess(了解)
    用来经过代码往cmd建立一个管道,而且发送命令和接收cmd返回的结果.
    import subprocess
    obj = subprocess.Popen(
        'cmd命令',
        shell=True,
        # 接收正确结果
        stdout=subprocess.PIPE,
        # 接收错误结果
        stderr=subprocess.PIPE
    )
    success = obj.stdout.read()
    error = obj.stderr.read()
    msg = success + error


5.黏包问题
    1.不能肯定对方发送数据的大小
    2.在短期内,间隔时间短,而且数据量小的状况, 默认将这些数据打包成一个
        屡次发送的数据 ---> 一次性发送

6.struct解决黏包问题
    初级版:
    i: 4
    能够将一个数据的长度打包成一个固定长度的报头.
    struct.pack('模式i', '源数据长度')
    data = 'gagawagwaga'
    # 打包成报头
    headers = struct.pack('i', len(data))

    # 解包获取数据真实长度
    data = struct.unpack('i', headers)[0]

    注意: 以什么方式打包,必须以什么方式解包.

    升级版:
        先将数据存放到字典中,将字典打包发送过去
        - 字典的好处:
            - 真实数据长度
            - 文件的描述信息
            - 发送的数据,更小

            dic = {
                'data_len': 1000000000000000000000046546544444444444444444444444444444444444444,
                文件的描述信息
            }

7.上传大文件数据
    # 客户端
    dic = {
            文件大小,
            文件名
           }

    with open(文件名, 'rb') as f:
        for line in f:
            client.send(line)


    # 服务端
    dic = {
            文件大小,
            文件名
           }
    init_recv = 0
    with open(文件名, 'wb') as f:
        while init_recv < 文件大小:
            data = conn.recv(1024)
            f.write(data)
            init_recv += len(data)


10.socketserver(现阶段,了解)
    - 能够支持并发
    import socketserver
    # 定义类
    # TCP: 必须继承BaseRequestHandler类
    class MyTcpServer(socketserver.BaseRequestHandler):

        - handle
            # 内部实现了
            server = socket.socket()
            server.bind(
                ('127.0.0.1', 9527)
            )
            server.listen(5)  ---

            while True:
                conn, addr = server.accept()
                print(addr)

        # 必须重写父类的handle, 当客户端链接时会调用该方法
        def handle(self):
            print(self.client_address)
            while True:
                try:
                    # 1.接收消息
                    # request.recv(1024) == conn.recv(1024)
                    data = self.request.recv(1024).decode('utf-8')
                    send_msg = data.upper()
                    self.request.send(send_msg.encode('utf-8'))

                except Exception as e:
                    print(e)
                    break
    TCP:
        SOCK_STREAM
        conn.recv()

    UDP模板:
        SOCK_DGRAM
        server.recvfrom()

        - 服务端
            import socket
            server = socket.socket(
                type=socket.SOCK_DGRAM
            )
            server.bind(
                (ip, port)
            )
            data, addr = server.recvfrom(1024)
            server.sendto(data, addr)

        - 客户端
            import socket
            client = socket.socket(
                type=socket.SOCK_DGRAM
            )
            ip_port = (ip, port)

            client.sendto(data, ip_port)

            data, _ = client.recvfrom(1024)
            print(data)


二 并发编程

12.多道技术
    - 单道

    - 多道: 切换 + 保存状态
        - 空间上的复用
            支持多个程序使用

        - 时间上的复用
            - 遇到IO操做就会切换程序
            - 程序占用CPU时间过长切换

13.并发与并行
    并发: 看起来像同时运行: 多道技术
    并行: 真正意义上的同时运行: 多核下


14.进程
    进程是资源单位,没建立一个进程都会生成一个名称空间,占用内存资源.

    - 程序与进程
          程序就是一堆代码
          进程就是一堆代码运行的过程

  - 进程调度
        - 时间片轮转法
            10个进程, 将固定时间,等分红10份时间片,分配给每个进程.

        - 分级反馈队列
            1级别:
            2级别:
            3级别:


  - 进程的三个状态
        - 就绪态:
            建立多个进程, 必需要排队准备运行

        - 运行态:
            进程开始运行, 1.结束  2.阻塞

        - 阻塞态:
            当运行态遇到IO操做,就会进阻塞态.

  - 同步与异步
        提交任务的方式
        - 同步: 同步提交, 串行,一个任务结束后,另外一个任务才能提交并执行.
        - 异步: 异步提交, 多个任务能够并发运行

  - 阻塞与非阻塞
    - 阻塞:
        阻塞态
    - 非阻塞:
        就绪态
        运行态

  - 同步和异步、阻塞和非阻塞的区别。
        二者是不一样的概念,不能混为一谈.

  - 建立进程的两种方式
        一:
            p = Process(target=任务, args=(任务的参数, ))
            p.daemon = True  # 必须放在start()前,不然报错
            p.start()  # 向操做系统提交建立进程的任务
            p.join()  # 向操做系统发送请求, 等全部子进程结束,父进程再结束

        二:
            class MyProcess(Process):
                def run(self):  # self == p
                    任务的过程

            p = MyProcess()
            p.daemon = True  # 必须放在start()前,不然报错
            p.start()  # 向操做系统提交建立进程的任务
            p.join()  # 向操做系统发送请求, 等全部子进程结束,父进程再结束


  - 回收进程资源的两种条件
        - 调用join让子结束后,主进程才能结束.
        - 主进程正常结束

15.僵尸进程与孤儿进程(了解)
    僵尸进程: 凡是子进程结束后,PID号还在, 主进程意外死亡,无法给子进程回收资源.
        - 每一个子进程结束后,都会变成,僵尸进程 (PID)

    孤儿进程: 凡是子进程没有结束,可是主进程意外死亡.操做系统优化机制(孤儿院),
    会将没有主,而且存活的进程,在该进程结束后回收资源.

16.守护进程
    只要父进程结束,全部的子进程都必须结束.

17.互斥锁
    将并发变成串行,牺牲执行效率,保证数据安全.

    from multiprocessing import Lock
    mutex = Lock()
    # 加锁
    mutex.acquire()
    修改数据
    mutex.release()

18.队列
    - FIFO队列: 先进先出
    from multiprocessing import Queue
    q = Queue(5)
    # 添加数据,若队列添加数据满了,则等待
    q.put()
    # 添加数据,若队列添加数据满了,直接报错
    q.put_nowait()

    # 获取队列中的数据
    q.get()  # 若队列中没数据,会卡住等待
    q.get_nowait()  # 若队列中没数据,会直接报错

19.堆栈
    LIFO

20.IPC进程间通讯
    - 进程间的数据是隔离的
    - 队列可让进程间通讯
    - 把一个程序放入队列中,另外一个程序从队列中获取,实现进程间数据交互


21.生产者与消费者 模型
    生产者: 生产数据
    消费者: 使用数据
    为了保证 供需平衡.

    经过队列实现, 生产者将数据扔进队列中,消费者从队列中获取数据.
        能够保证一边生产一边消费.



22.线程
    - 什么是线程
        - 进程: 资源单位
        - 线程: 执行单位
            - 建立进程时,会自带一个线程

        一个进程下能够建立多个线程.

    - 使用线程的好处
        节省资源的开销

    - 进程与线程优缺点:
        - 进程:
            优势:
                - 多核下能够并行执行
                - 计算密集型下提升效率

            缺点:
                - 开销资源远高于线程

        - 线程:
            优势:
                - 占用资源远比进程小
                - IO密集型下提升效率

            缺点:
                - 没法利用多核优点


23.线程间数据是共享的
    - 画图

24.GIL全局解释器锁

    - 只有Cpython才有自带一个GIL全局解释器锁
    1.GIL本质上是一个互斥锁.
    2.GIL的为了阻止同一个进程内多个线程同时执行(并行)
        - 单个进程下的多个线程没法实现并行,但能实现并发

    3.这把锁主要是由于CPython的内存管理不是 "线程安全" 的.
        - 内存管理
            - 垃圾回收机制

            注意: 多个线程过来执行,一旦遇到IO操做,就会立马释放GIL解释器锁,交给下一个先进来的线程.

    总结: GIL的存在就是为了保证线程安全的,保证数据安全

25.多线程使用的好处
    - 多线程:
        IO密集型,提升效率

    - 多进程
        计算密集型,提升效率

26.死锁现象(了解)

27.递归锁(了解,之后不用)
    解决死锁现象
    mutex = Lock()  # 只能引用1次
    mutex1, mutex2 = RLock()  # 能够引用屡次
    +1, 只要这把锁计数为0释放该锁, 让下一我的使用, 就不会出现死锁现象.

28.信号量(绝对了解)
    信号量也是一把锁, 可让多个任务一块儿使用.
    互斥锁:
        只能让一个任务使用
    信号量:
        可让多个任务一块儿使用.
        sm = Semaphore(5)  可让5个任务使用

29.线程队列
    使用场景:
        若线程间数据不安全状况下使用线程队列, 为了保证线程间数据的安全.
    import queue
    - FIFO: 先进先出队列
        queue.Queue()
    - LIFO: 后进先出队列
        queue.LifoQueue()
    - 优先级队列:
        - 根据数字大小判断,判断出队优先级.
        - 进队数据是无序的
        queue.PriorityQueue()

30.event事件
    能够控制线程的执行,让一些线程控制另外一些线程的执行.
    e = Event()

    - 线程1
    e.set()  # 给线程2发送信号,让他执行

    - 线程2
    e.wait()  # 等待线程1的信号

31.进程池与线程池
    为了控制进程/线程建立的数量,保证了硬件能正常运行.
    from concurrent.futures import ProcessPoolExecutor, ThreadPoolExecutor

    pool1 = ProcessPoolExecutor()  # 默认CPU个数
    pool2 = ThreadPoolExecutor()  # CPU个数 * 5
    pool3 = ProcessPoolExecutor(100)  # 100个
    pool4 = ThreadPoolExecutor(200)  # 200个

    # 将函数地址的执行结果,给回调函数
    pool4.submit(函数地址, 参数).add_done_callback(回调函数地址)

    - 回调函数(必须接收一个参数res):
        # 获取值
        res2 = res.result()

32.协程
    - 进程: 资源单位
    - 线程: 执行单位
    - 协程: 单线程下实现并发, 不是任何的单位,是程序员YY出来的名字.

    - 单线程下实现并发
        好处是节省资源, 单线程 < 多线程 < 多进程

        - IO密集型下:
            协程有优点

        - 计算密集型下:
            进程有优点

    - 高并发:
        - 多进程 + 多线程 + 协程   (Nginx)

    协程的建立:
        手动实现切换 + 保存状态:
            - yield

            - 函数一直在调用next()
                会不停地切换

            yield不能监听IO操做的任务
            - gevent来实现监听IO操做

33.gevent
    pip3 install gevent
    from gevent import monkey
    monkey.patch_all()  # 设置监听全部IO
    from gevent import spawn, joinall  # 实现 切换 + 保存状态

    - 实现了单线程下实现并发
    s1 = spawn(任务1)
    s2 = spawn(任务2)
    joinall([s1, s2])

34.IO模型(了解)
    - 阻塞IO
    - 非阻塞IO
    - 多路复用IO
    - 异步IO
网络编程 与 并发编程 汇总

软件开发架构:

网络编程与并发编程汇总