非阻塞io和异步io的区别,io操作的三种处理方式

5种IO模型、阻塞IO和非阻塞IO、同步IO和异步IO
看了一些文章,发现有很多不同的理解,可能是因为大家入切的角度、环境不一样 。所以,我们先说明基本的IO操作及环境 。本文是在《UNIX网络编程 卷1:套接字联网API》6.2节"I/O 模型 "的基础上,即UNIX/LINUX环境下的网络 IO环境下的理解,它里面给出的例子是读?。ń邮眨┩?鏤DP数据 。下面简单写写自己对这些IO模型的理解 。
1、IO

非阻塞io和异步io的区别,io操作的三种处理方式

文章插图
IO (Input/Output , 输入/输出)即数据的读?。ń邮眨┗蛐慈耄ǚ⑺停┎僮?nbsp;, 通常用户进程中的一个完整IO分为两阶段:用户进程空间<-->内核空间、内核空间<-->设备空间(磁盘、网络等) 。IO有内存IO、网络IO和磁盘IO三种,通常我们说的IO指的是后两者 。
LINUX中进程无法直接操作I/O设备 , 其必须通过系统调用请求kernel来协助完成I/O动作;内核会为每个I/O设备维护一个缓冲区 。
对于一个输入操作来说,进程IO系统调用后 , 内核会先看缓冲区中有没有相应的缓存数据,没有的话再到设备中读?。?因为设备IO一般速度较慢 , 需要等待;内核缓冲区有数据则直接复制到进程空间 。
所以,对于一个网络输入操作通常包括两个不同阶段:
(1)等待网络数据到达网卡→读取到内核缓冲区,数据准备好;
(2)从内核缓冲区复制数据到进程空间 。
2、5种IO模型
《UNIX网络编程》说得很清楚,5种IO模型分别是阻塞IO模型、非阻塞IO模型、IO复用模型、信号驱动的IO模型、异步IO模型;前4种为同步IO操作,只有异步IO模型是异步IO操作 。下面这样些图,是它里面给出的例子:接收网络UDP数据的流程在IO模型下的分析,在它的基础上再加以简单描述,以区分这些IO模型 。
2-1、阻塞IO模型
非阻塞io和异步io的区别,io操作的三种处理方式

文章插图
进程发起IO系统调用后,进程被阻塞,转到内核空间处理,整个IO处理完毕后返回进程 。操作成功则进程获取到数据 。
1、典型应用:阻塞socket、Java BIO;
2、特点:
进程阻塞挂起不消耗CPU资源 , 及时响应每个操作;
实现难度低、开发应用较容易;
适用并发量小的网络应用开发;
不适用并发量大的应用:因为一个请求IO会阻塞进程,所以,得为每请求分配一个处理进程(线程)以及时响应,系统开销大 。
2-2、非阻塞IO模型
非阻塞io和异步io的区别,io操作的三种处理方式

文章插图
进程发起IO系统调用后,如果内核缓冲区没有数据,需要到IO设备中读取,进程返回一个错误而不会被阻塞;进程发起IO系统调用后 , 如果内核缓冲区有数据,内核就会把数据返回进程 。
对于上面的阻塞IO模型来说,内核数据没准备好需要进程阻塞的时候,就返回一个错误,以使得进程不被阻塞 。
1、典型应用:socket是非阻塞的方式(设置为NONBLOCK)
2、特点:
进程轮询(重复)调用,消耗CPU的资源;
实现难度低、开发应用相对阻塞IO模式较难;
适用并发量较小、且不需要及时响应的网络应用开发;
2-3、IO复用模型
非阻塞io和异步io的区别,io操作的三种处理方式

文章插图
多个的进程的IO可以注册到一个复用器(select)上,然后用一个进程调用该select,select会监听所有注册进来的IO;
如果select没有监听的IO在内核缓冲区都没有可读数据 , select调用进程会被阻塞;而当任一IO在内核缓冲区中有可数据时,select调用就会返回;
而后select调用进程可以自己或通知另外的进程(注册进程)来再次发起读取IO,读取内核中准备好的数据 。
可以看到,多个进程注册IO后,只有另一个select调用进程被阻塞 。
1、典型应用:select、poll、epoll三种方案 , nginx都可以选择使用这三个方案;Java NIO;
2、特点:
专一进程解决多个进程IO的阻塞问题,性能好;Reactor模式;
实现、开发应用难度较大;
适用高并发服务应用开发:一个进程(线程)响应多个请求;
3、select、poll、epoll
Linux中IO复用的实现方式主要有select、poll和epoll:
Select:注册IO、阻塞扫描,监听的IO最大连接数不能多于FD_SIZE;
Poll:原理和Select相似,没有数量限制,但IO数量大扫描线性性能下降;
Epoll :事件驱动不阻塞 , mmap实现内核与用户空间的消息传递 , 数量很大,Linux2.6后内核支持;


推荐阅读