10大高性能开发宝石,我要消灭一半程序员

程序员经常要面临的一个问题就是:如何提高程序性能?
这篇文章,我们循序渐进,从内存、磁盘I/O、网络I/O、CPU、缓存、架构、算法等多层次递进,串联起高性能开发十大必须掌握的核心技术 。

  • - I/O优化:零拷贝技术
  • - I/O优化:多路复用技术
  • - 线程池技术
  • - 无锁编程技术
  • - 进程间通信技术
  • - RPC && 序列化技术
  • - 数据库索引技术
  • - 缓存技术 && 布隆过滤器
  • - 全文搜索技术
  • - 负载均衡技术
准备好了吗,坐稳了,发车!
首先,我们从最简单的模型开始 。
老板告诉你,开发一个静态web服务器,把磁盘文件(网页、图片)通过网络发出去,怎么做?
你花了两天时间,撸了一个1.0版本:
  • 主线程进入一个循环,等待连接
  • 来一个连接就启动一个工作线程来处理
  • 工作线程中,等待对方请求,然后从磁盘读文件、往套接口发送数据,完事儿
上线一天,老板发现太慢了,大一点的图片加载都有卡顿感 。让你优化,这个时候,你需要:
I/O优化:零拷贝技术
上面的工作线程,从磁盘读文件、再通过网络发送数据,数据从磁盘到网络,兜兜转转需要拷贝四次,其中CPU亲自搬运都需要两次 。
10大高性能开发宝石,我要消灭一半程序员

文章插图
 
零拷贝技术,解放CPU,文件数据直接从内核发送出去,无需再拷贝到应用程序缓冲区,白白浪费资源 。
10大高性能开发宝石,我要消灭一半程序员

文章插图
 
linux API:
ssize_t sendfile(int out_fd,int in_fd,off_t *offset,size_t count); 函数名字已经把函数的功能解释的很明显了:发送文件 。指定要发送的文件描述符和网络套接字描述符,一个函数搞定!
用上了零拷贝技术后开发了2.0版本,图片加载速度明显有了提升 。不过老板发现同时访问的人变多了以后,又变慢了,又让你继续优化 。这个时候,你需要:
I/O优化:多路复用技术
前面的版本中,每个线程都要阻塞在recv等待对方的请求,这来访问的人多了,线程开的就多了,大量线程都在阻塞,系统运转速度也随之下降 。
这个时候,你需要多路复用技术,使用select模型,将所有等待(accept、recv)都放在主线程里,工作线程不需要再等待 。
10大高性能开发宝石,我要消灭一半程序员

文章插图
 
过了一段时间之后,网站访问的人越来越多了,就连select也开始有点应接不暇,老板继续让你优化性能 。
这个时候,你需要升级多路复用模型为epoll 。
select有三弊,epoll有三优 。
  • select底层采用数组来管理套接字描述符,同时管理的数量有上限,一般不超过几千个,epoll使用树和链表来管理,同时管理数量可以很大 。
  • select不会告诉你到底哪个套接字来了消息,你需要一个个去询问 。epoll直接告诉你谁来了消息,不用轮询 。
  • select进行系统调用时还需要把套接字列表在用户空间和内核空间来回拷贝,循环中调用select时简直浪费 。epoll统一在内核管理套接字描述符,无需来回拷贝 。
用上了epoll多路复用技术,开发了3.0版本,你的网站能同时处理很多用户请求了 。
但是贪心的老板还不满足,不舍得升级硬件服务器,却让你进一步提高服务器的吞吐量 。你研究后发现,之前的方案中,工作线程总是用到才创建,用完就关闭,大量请求来的时候,线程不断创建、关闭、创建、关闭,开销挺大的 。这个时候,你需要:
线程池技术
我们可以在程序一开始启动后就批量启动一波工作线程,而不是在有请求来的时候才去创建,使用一个公共的任务队列,请求来临时,向队列中投递任务,各个工作线程统一从队列中不断取出任务来处理,这就是线程池技术 。
10大高性能开发宝石,我要消灭一半程序员

文章插图
 
多线程技术的使用一定程度提升了服务器的并发能力,但同时,多个线程之间为了数据同步,常常需要使用互斥体、信号、条件变量等手段来同步多个线程 。这些重量级的同步手段往往会导致线程在用户态/内核态多次切换,系统调用,线程切换都是不小的开销 。
在线程池技术中,提到了一个公共的任务队列,各个工作线程需要从中提取任务进行处理,这里就涉及到多个工作线程对这个公共队列的同步操作 。


推荐阅读