Owen Garrett是Nginx公司的产品总监,他在Nginx的官方博客上发表了一篇博文http://www.infoq.com/news/2015/06/nginx-design-performance-scale-,说明了是哪些设计决策使得NGINX产品具备一流的性能和扩展能力。
NGINX的整体架构的特点是由一组进程协同工作:
主进程:负责执行特权操作,如阅读配置文件、绑定套接字、创建/通知协调(Signalling)子进程。
工作进程:负责接收和处理连接请求,读取和写入磁盘,并与上游服务器通信。当NGINX处于活跃状态时,只有工作进程是忙碌的。
缓存加载器进程:负责将磁盘高速缓存加载到内存中。这个进程在启动时运行后随即退出。
缓存管理器进程:负责整理磁盘缓存的数据保证其不越界。这个进程会间歇性运行。
NGINX能够实现高性能和可扩展性的关键取决于两个基本的设计选型:
尽可能限制工作进程的数量,从而减少上下文切换带来的开销。默认和推荐配置是让每个CPU内核对应一个工作进程,从而高效利用硬件资源。
工作进程采用单线程,并以非阻塞的方式处理多个并发连接。
NGINX的每个工作进程通过状态机处理多个连接请求,这个状态机被实现为非阻塞的工作方式:
每个工作进程需要处理若干套接字,包括监听套接字或者连接套接字。
当监听套接字收到新的请求时,会打开一个新的连接套接字来处理与客户端的通信。
当一个事件到达连接套接字时,工作进程迅速完成响应,并转而处理其他任何套接字新收到的事件。
Garrett说,NGINX选择这样的设计,使它从根本上区别于其他Web服务器。通常的Web服务器会选用将每个连接分配给独立线程的模式,这使得多个连接的处理非常容易,因为每个连接可以被认为是包含多个步骤的一个线性序列,但这样会产生上下文切换的开销。事实上,工作线程大部分的时间处于阻塞的状态,在等待客户端或其它上游服务器。当试图执行I/O等操作的并发连接数/线程数的规模超过一定阈值,或是内存消耗殆尽的时候,上下文切换的成本就显现出来了。
从另一方面讲,NGINX的设计是不让工作进程阻止网络流量,除非没有任何工作要做。此外,每一个新的连接只消耗很少的资源,仅包括一个文件描述符和少量的工作进程内存。
总的来说,NGINX的这种工作模式在系统调优后,它的每个工作进程都能够处理成百上千的HTTP并发连接。