如何监控 Nginx?
什么是 Nginx?
Nginx ("engine-x")是一个 HTTP 和反向代理服务器,同时也是一个邮件代理服务器和通用的 TCP 代理服务器。作为一个免费开源的服务器,Nginx 具有高性能、稳定和较低的资源占用的特点。它拥有丰富的特征集,同时配置也很简单。
Nginx 是少数几个可以解决 C10K 问题的服务器之一。不同于传统服务器,它使用可扩展的时间驱动(异步)架构替代线程来处理请求。尤为重要的是,该架构占用负载下的内存小,且可预测。即便不需要同时处理数千的网络请求,你仍然能从Nginx 的高性能和低内存占用中受益。从最小的VPS到大型集群服务器,Nginx 都能适用。
Nginx 还有一个商业版 Nginx Plus ,功能更加丰富。
监控 Nginx 的参数
Nginx 提供哪些监控参数
下表是 Nginx 提供的监控参数及其简单释义。
参数名称 | 参数描述 |
---|---|
Active connections | 当前活跃的用户连接(包含Waiting状态) |
accepts | 接收到的用户连接总数 |
handled | Nginx处理的用户连接总数 |
requests | 用户请求总数 |
Reading | 当前连接中Nginx读取请求首部的个数 |
Writing | 当前连接中Nginx写返回给用户的个数 |
Waiting | 当前没有请求的活跃用户连接数 |
通过下面的图,可以清晰的看到参数的具体意义和作用。
当用户请求连接Nginx服务器时,accepts计数器会加一。且当服务器处理该连接请求时,handled计数器同样会加一。一般而言,两者的值是相等的,除非达到了某些资源极限(如worker_connection的限制)。
用户连接请求被处理,就会进入 active 状态。如果该连接没有其他 request,则进入 waiting 的子状态;如果有 request,nginx 会读取 request 的 header,计数器 request 加一,进入 reading 的子状态。 reading 状态持续时间非常短,header 被读取后就会进入 writing 状态。事实上,直到服务器将响应结果返回给用户之前,该连接会一直保持 writing 状态。所以说,writing 状态一般会被长时间占用。
Nginx提供哪些监控参数
下表是Nginx Plus提供的主要监控参数、说明以及和Nginx的差异。
参数名称 | 参数描述 | 与Nginx差异 |
---|---|---|
Active | 当前活跃的用户连接(不包含 Idel 状态) | 等同 Active connections |
Accepted | 接收到的用户连接总数 | 等同 accepts |
Dropped | Nginx 丢弃的用户连接总数 | accepts - handled |
Idle | 当前没有请求的活跃用户连接数 | 等同 Waiting |
Total | 用户请求总数 | 等同 requests |
Current(Requests) | 当前有请求的活跃用户连接数(等同 Active) | Reading + Writing |
Current(Connections) | 当前在线用户数(Active + Idle) | Reading + Writing + Waiting |
主要参数和开源的Nginx相比较,区别不大。主要就是换了名字,以及通过加减法的参数整合。同样,通过下面的图也能看清这些参数的作用。
具体运作和Nginx并无不同,故不赘述。当然,作为商业版,它提供的参数还有很多,可以在 这里 看。
怎么利用这些参数
开源的 Nginx 提供的原始参数中,实时性的会比较有用,如 Active connections、Reading、Writing 以及 Waiting。这些数据能够反映当前 Nginx 的负载情况,方便在服务器出现问题时及时发现问题。而另一些数据由于不是状态量,Nginx 无法计算当前的量值而改做其统计数,如 accepts、handled 和 requests。
对于维护网站人员,accepts、handled 和 requests 的统计值用处是不大的,值得参考的是短时间内这三者数值的增量。这个短时间可以是一秒,如 accepts per second、handled per second 和 requests per second。一个简单的做法就是每秒都去读取这些参数,返回一个和上一秒的差值就行。当然,handled per second 替换成 dropped per second=accepts per second-handled per second 就更完美了。
通过这七个参数,就可以从连接到请求全方位的监控起 Nginx 的运行状态。为了方便检测,对每次获取的参数保留下来,然后按时间展现出来。下图展示了 Nginx 在运行时的参考数据。
如何获取Nginx 性能监控参数
开源的 Nginx 会提供一个子网页显示前文提到的监控参数。该网页默认时不开启的,需要开放 ngx http stub status module 来解锁。默认该模块是开放的,通过以下命令,可以快速确定该模块是否已被开放。
nginx -V 2>&1 | grep -o with-http_stub_status_module
如过返回 with-http stub status module ,则说明该模块已被开放,而什么都不返回的话就是没有被开放。需要通过原码构建 Nginx 加上配置参数 --with-httpstub status module :
./configure \ … \ --with-http_stub_status_module make sudo make install
以上步骤搞定后,还有需要一个配置 URL 来开启 Nginx 状态页。打开你的网站对应 Nginx 的配置文件,添加以下修改:
server{ listen your-website-port; location /basic_status { stub_status; } }
如果 Nginx 版本低于1.7.5,则需要语法指令添加参数(任意参数):
server{ listen your-website-port; location /basic_status { stub_status on; } }
修改完成后,需要重新载入 Nginx,键入命令 nginx -s reload ,然后就能在状态页(127.0.0.1:your-website-port/basic_status)看见你的监控参数了。大概是这个样子:
Active connections: 1 server accepts handled requests 38 38 38 Reading: 0 Writing: 1 Waiting: 0
Nginx Plus 和 Nginx 在前面的设置差不多。配置状态页时,需要在配置文件中加上 server 模块:
server { listen your-website-port; location /status { status; } location = /status.html { } }
重载一下Nginx,你会在状态页(127.0.0.1:your-website-port/status.html)看到大概这个样子:
顺便安利一下,装一个Ci,就能看到前面关于 Nginx 基于时间的运行状态的图了。免费注册免费使用,还能设置报警策略。具体,戳这里。
Cloud Insight 集监控、管理、计算、协作、可视化于一身,帮助所有 IT 公司,减少在系统监控上的人力和时间成本投入,让运维工作更加高效、简单。 本文系国内 ITOM 行业领军企业OneAPM 工程师原创。想阅读更多技术文章,请访问OneAPM 官方技术博客 。