文章插图
IO 多路复用就是我们说的select , poll , epoll , 有些地方也称这种IO方式为event driven IO 。
select/epoll的好处就在于单个process就可以同时处理多个网络连接的IO 。
它的基本原理就是select , poll , epoll这个function会不断的轮询所负责的所有socket , 当某个socket有数据到达了 , 就通知用户进程 。
epoll简单模型【Python Web静态服务器-epoll】import socketimport select# 创建套接字s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)# 设置可以重复使用绑定的信息s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR,1)# 绑定本机信息s.bind(("",7788))# 变为被动s.listen(10)# 创建一个epoll对象epoll = select.epoll()# 测试 , 用来打印套接字对应的文件描述符# print(s.fileno())# print(select.EPOLLIN|select.EPOLLET)# 注册事件到epoll中# epoll.register(fd[, eventmask])# 注意 , 如果fd已经注册过 , 则会发生异常# 将创建的套接字添加到epoll的事件监听中epoll.register(s.fileno(), select.EPOLLIN|select.EPOLLET)connections = {}addresses = {}# 循环等待客户端的到来或者对方发送数据while True: # epoll 进行 fd 扫描的地方 -- 未指定超时时间则为阻塞等待 epoll_list = epoll.poll() # 对事件进行判断 for fd, events in epoll_list: # print fd # print events # 如果是socket创建的套接字被激活 if fd == s.fileno(): new_socket, new_addr = s.accept() print('有新的客户端到来%s' % str(new_addr)) # 将 conn 和 addr 信息分别保存起来 connections[new_socket.fileno()] = new_socket addresses[new_socket.fileno()] = new_addr # 向 epoll 中注册 新socket 的 可读 事件 epoll.register(new_socket.fileno(), select.EPOLLIN|select.EPOLLET) # 如果是客户端发送数据 elif events == select.EPOLLIN: # 从激活 fd 上接收 recvData = connections[fd].recv(1024).decode("utf-8") if recvData: print('recv:%s' % recvData) else: # 从 epoll 中移除该 连接 fd epoll.unregister(fd) # server 侧主动关闭该 连接 fd connections[fd].close() print("%s---offline---" % str(addresses[fd])) del connections[fd] del addresses[fd]说明
EPOLLIN (可读)
EPOLLOUT (可写)
EPOLLET (ET模式)
epoll对文件描述符的操作有两种模式:LT(level trigger)和ET(edge trigger) 。LT模式是默认模式 , LT模式与ET模式的区别如下:
LT模式:当epoll检测到描述符事件发生并将此事件通知应用程序 , 应用程序可以不立即处理该事件 。下次调用epoll时 , 会再次响应应用程序并通知此事件 。ET模式:当epoll检测到描述符事件发生并将此事件通知应用程序 , 应用程序必须立即处理该事件 。如果不处理 , 下次调用epoll时 , 不会再次响应应用程序并通知此事件 。web静态服务器-epool
以下代码 , 支持http的长连接 , 即使用了Content-Length
import socketimport timeimport sysimport reimport selectclass WSGIServer(object): """定义一个WSGI服务器的类""" def __init__(self, port, documents_root): # 1. 创建套接字 self.server_socket = socket.socket(socket.AF_INET, socket.SOCK_STREAM) # 2. 绑定本地信息 self.server_socket.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1) self.server_socket.bind(("", port)) # 3. 变为监听套接字 self.server_socket.listen(128) self.documents_root = documents_root # 创建epoll对象 self.epoll = select.epoll() # 将tcp服务器套接字加入到epoll中进行监听 self.epoll.register(self.server_socket.fileno(), select.EPOLLIN|select.EPOLLET) # 创建添加的fd对应的套接字 self.fd_socket = dict() def run_forever(self): """运行服务器""" # 等待对方链接 while True: # epoll 进行 fd 扫描的地方 -- 未指定超时时间则为阻塞等待 epoll_list = self.epoll.poll() # 对事件进行判断 for fd, event in epoll_list: # 如果是服务器套接字可以收数据 , 那么意味着可以进行accept if fd == self.server_socket.fileno(): new_socket, new_addr = self.server_socket.accept() # 向 epoll 中注册 连接 socket 的 可读 事件 self.epoll.register(new_socket.fileno(), select.EPOLLIN | select.EPOLLET) # 记录这个信息 self.fd_socket[new_socket.fileno()] = new_socket # 接收到数据 elif event == select.EPOLLIN: request = self.fd_socket[fd].recv(1024).decode("utf-8") if request: self.deal_with_request(request, self.fd_socket[fd]) else: # 在epoll中注销客户端的信息 self.epoll.unregister(fd) # 关闭客户端的文件句柄 self.fd_socket[fd].close() # 在字典中删除与已关闭客户端相关的信息 del self.fd_socket[fd] def deal_with_request(self, request, client_socket): """为这个浏览器服务器""" if not request: return request_lines = request.splitlines() for i, line in enumerate(request_lines): print(i, line) # 提取请求的文件(index.html) # GET /a/b/c/d/e/index.html HTTP/1.1 ret = re.match(r"([^/]*)([^ ]+)", request_lines[0]) if ret: print("正则提取数据:", ret.group(1)) print("正则提取数据:", ret.group(2)) file_name = ret.group(2) if file_name == "/": file_name = "/index.html" # 读取文件数据 try: f = open(self.documents_root+file_name, "rb") except: response_body = "file not found, 请输入正确的url" response_header = "HTTP/1.1 404 not foundrn" response_header += "Content-Type: text/html; charset=utf-8rn" response_header += "Content-Length: %drn" % len(response_body) response_header += "rn" # 将header返回给浏览器 client_socket.send(response_header.encode('utf-8')) # 将body返回给浏览器 client_socket.send(response_body.encode("utf-8")) else: content = f.read() f.close() response_body = content response_header = "HTTP/1.1 200 OKrn" response_header += "Content-Length: %drn" % len(response_body) response_header += "rn" # 将数据返回给浏览器 client_socket.send(response_header.encode("utf-8")+response_body)# 设置服务器服务静态资源时的路径DOCUMENTS_ROOT = "./html"def main(): """控制web服务器整体""" # Python3 xxxx.py 7890 if len(sys.argv) == 2: port = sys.argv[1] if port.isdigit(): port = int(port) else: print("运行方式如: python3 xxx.py 7890") return print("http服务器使用的port:%s" % port) http_server = WSGIServer(port, DOCUMENTS_ROOT) http_server.run_forever()if __name__ == "__main__": main()
推荐阅读
- WEB 应用防火墙 的天问
- 手机如何设置静态IP地址?很简单,只需这样操作
- Nginx 静态文件服务配置及优化
- Python Django框架
- Centos7环境下快速安装Pyspider WEB爬虫框架和phantomjs浏览器
- Web实现前后端分离解析
- Python网络爬虫之URL去重方法:本地内存,Redis,布隆过滤器
- python 进程、线程、协程对比
- python:教你用爬虫通过代理自动刷网页的浏览量
- python正则表达式re模块的高级用法