1. 初探在了解异步协程之前,我们首先得了解一些基础概念,如阻塞和非阻塞、同步和异步、多进程和协程 。
文章插图
1.1 阻塞阻塞状态指程序未得到所需计算资源时被挂起的状态 。程序在等待某个操作完成期间,自身无法继续处理其他的事情,则称该程序在该操作上是阻塞的 。
常见的阻塞形式有:
- 网络 I/O 阻塞
- 磁盘 I/O 阻塞
- 用户输入阻塞等 。
1.2 非阻塞程序在等待某操作过程中,自身不被阻塞,可以继续处理其他的事情,则称该程序在该操作上是非阻塞的 。
非阻塞并不是在任何程序级别、任何情况下都可以存在的 。仅当程序封装的级别可以囊括独立的子程序单元时,它才可能存在非阻塞状态 。
非阻塞的存在是因为阻塞存在,正因为某个操作阻塞导致的耗时与效率低下,我们才要把它变成非阻塞的 。
1.3 同步不同程序单元为了完成某个任务,在执行过程中需靠某种通信方式以协调一致,我们称这些程序单元是同步执行的 。
例如购物系统中更新商品库存,需要用“行锁”作为通信信号,让不同的更新请求强制排队顺序执行,那更新库存的操作是同步的 。
简言之,同步意味着有序 。
1.4 异步为完成某个任务,不同程序单元之间过程中无需通信协调,也能完成任务的方式,不相关的程序单元之间可以是异步的 。
例如,爬虫下载网页 。调度程序调用下载程序后,即可调度其他任务,而无需与该下载任务保持通信以协调行为 。不同网页的下载、保存等操作都是无关的,也无需相互通知协调 。这些异步操作的完成时刻并不确定 。
简言之,异步意味着无序 。
1.5 多进程多进程就是利用 CPU 的多核优势,在同一时间并行地执行多个任务,可以大大提高执行效率 。
文章插图
1.6 协程协程,英文叫作 Coroutine,又称微线程、纤程,协程是一种用户态的轻量级线程 。
协程拥有自己的寄存器上下文和栈 。协程调度切换时,将寄存器上下文和栈保存到其他地方,在切回来的时候,恢复先前保存的寄存器上下文和栈 。因此协程能保留上一次调用时的状态,即所有局部状态的一个特定组合,每次过程重入时,就相当于进入上一次调用的状态 。
协程本质上是个单进程,协程相对于多进程来说,无需线程上下文切换的开销,无需原子操作锁定及同步的开销,编程模型也非常简单 。
我们可以使用协程来实现异步操作,比如在网络爬虫场景下,我们发出一个请求之后,需要等待一定的时间才能得到响应,但其实在这个等待过程中,程序可以干许多其他的事情,等到响应得到之后才切换回来继续处理,这样可以充分利用 CPU 和其他资源,这就是协程的优势 。
1.7 协程相对于多线程的优点多线程编程是比较困难的, 因为调度程序任何时候都能中断线程, 必须记住保留锁, 去保护程序中重要部分, 防止多线程在执行的过程中断 。
而协程默认会做好全方位保护, 以防止中断 。我们必须显示产出才能让程序的余下部分运行 。对协程来说, 无需保留锁, 而在多个线程之间同步操作, 协程自身就会同步, 因为在任意时刻, 只有一个协程运行 。总结下大概下面几点:
- 无需系统内核的上下文切换,减小开销;
- 无需原子操作锁定及同步的开销,不用担心资源共享的问题;
- 单线程即可实现高并发,单核 CPU 即便支持上万的协程都不是问题,所以很适合用于高并发处理,尤其是在应用在网络爬虫中 。
Python 中使用协程最常用的库莫过于 asyncio,所以本文会以 asyncio 为基础来介绍协程的使用 。
首先我们需要了解下面几个概念 。
- event_loop:事件循环,相当于一个无限循环,我们可以把一些函数注册到这个事件循环上,当满足条件发生的时候,就会调用对应的处理方法 。
推荐阅读
- 看我怎么通过Python脚本给100台网络设备一键化下发相同的配置
- 无货源店铺现在还能做吗 无货源开店还能不能做
- 2020开网店还能行吗 2020年开网店咋样
- 教师|专业还会影响择偶?这几个专业择偶时不占优势,男同学要谨慎考虑
- 淘宝直通车推广怎么做 淘宝直通车精准推广还是广泛推广好
- 淘宝网店虚拟店还能开吗 淘宝虚拟产品开店教程
- 直通车智能计划点击率低 直通车标准好还是智能好
- 万圣节吃糖还是万圣夜吃糖
- 淘宝开店还有前景吗 现在开淘宝店前景怎么样
- 水培富贵竹,7个技巧能快速生根,还要注意4个方面,才能油绿旺盛