三分钟告诉你如何监控 Linux 服务器状态?

linux 服务器我们天天打交道,特别是 Linux 工程师更是如此 。为了保证服务器的安全与性能,我们经常需要监控服务器的一些状态,以保证工作能顺利开展 。
本文介绍的几个命令,不仅仅适用于服务器监控,也适用于我们日常情况下的开发 。
1. watchwatch 命令我们的使用频率很高,它的基本作用是,按照指定频率重复执行某一条指令 。使用这个命令,我们可以重复调用一些命令来达到监控服务器的作用 。
默认情况下,watch 命令的执行周期是 2 秒,但我们可以使用 -n 选项来指定运行频率,比如我们想要每隔 5 秒执行 date 命令,可以这么执行:
$ watch -n 5 date一台服务器肯定有多人在用,特别是本部门的小伙伴 。对于这些小伙伴有没浑水摸鱼,我们可以使用一些命令来监控他们 。
我们可以每隔 10 秒执行 who 命令,来看看都有谁在使用服务器 。
$ watch -n 10 whoEvery 10.0s: whobutterfly: Tue Jan 23 16:02:03 2019shs:02019-01-23 09:45 (:0)dorypts/02019-01-23 15:50 (192.168.0.5)alvinpts/12019-01-23 16:01 (192.168.0.15)sharkpts/32019-01-23 11:11 (192.168.0.27)如果发现系统运行很慢,我们可以调用 uptime 命令来查看系统平均负载情况 。
$ watch uptimeEvery 2.0s: uptimebutterfly: Tue Jan 23 16:25:48 2019 16:25:48 up 22 days,4:38,3 users,load average: 1.15, 0.89, 1.02一些关键的进程肯定不能挂,否则可能会影响到业务开展,所以我们可以重复统计服务器中的所有进程数量 。
$ watch -n 5 'ps -ef | wc -l'Every 5.0s: ps -ef | wc -lbutterfly: Tue Jan 23 16:11:54 2019245想动态知道服务器内存使用情况,可以重复执行 free 命令 。
$ watch -n 5 free -mEvery 5.0s: free -mbutterfly: Tue Jan 23 16:34:09 2019totalusedfreesharedbuff/cacheavailableMem:595977632761219064878Swap:204702047当然不仅仅是这些,我们还可以重复调用很多命令来对服务器一些关键参数进行监控,
2. top使用 top 命令我们可以知道系统的很多关键参数,而且是动态更新的 。默认情况下,top 监控的是系统的整体状态,如果我们只想知道某个人的使用情况,可以使用 -u 选项来指定这个人 。
$ top -u alvintop - 16:14:33 up 2 days,4:27,3 users,load average: 0.00, 0.01, 0.02Tasks: 199 total,1 running, 198 sleeping,0 stopped,0 zombie%Cpu(s):0.0 us,0.2 sy,0.0 ni, 99.8 id,0.0 wa,0.0 hi,0.0 si,0.0 stMiB Mem :5959.4 total,3277.3 free,776.4 used,1905.8 buff/cacheMiB Swap:2048.0 total,2048.0 free,0.0 used.4878.4 avail MemPID USERPRNIVIRTRESSHR S%CPU%MEMTIME+ COMMAND23026 alvin2004634078206504 S0.00.10:00.05 systemd23033 alvin200149660314072 S0.00.10:00.00 (sd-pam)23125 alvin2006339651004092 S0.00.10:00.00 sshd23128 alvin2001683656364284 S0.00.10:00.03 zsh在这个结果里,你不仅仅可以看到 alvin 这个用户运行的所有的进程数,也可以看到每个进程所消耗的系统资源(CPU,内存),同时依然可以看到整个系统的关键参数 。
3. ac如果你想知道每个用户登录服务器所使用的时间,你可以使用 ac 命令 。这个命令需要你安装 acct 包(Debian)或 psacct 包(RHEL,centos) 。
如果我们想知道所有用户登陆服务器所使用的时间之和,我们可以直接运行 ac 命令,无需任何参数 。
$ actotal1261.72如果我们想知道各个用户所使用时间,可以加上 -p 选项 。
$ ac -pshark5.24alvin5.52shs1251.00total1261.76我们还可以通过加上 -d 选项来查看具体每一天用户使用服务器时间之和 。
$ ac -d | tail -10Jan 11total0.05Jan 12total1.36Jan 13total16.39Jan 15total55.33Jan 16total38.02Jan 17total28.51Jan 19total48.66Jan 20total1.37Jan 22total23.48Todaytotal9.83小结我们可以使用很多命令来监控系统的运行状态,本文主要介绍了三个:watch 命令可以让你重复执行某一条命令来监控一些参数的变化,top 命令可以查看某个用户运行的进程数以及消耗的资源,而 ac 命令则可以查看每个用户使用服务器时间 。你经常使用哪个命令呢?欢迎留言讨论!

【三分钟告诉你如何监控 Linux 服务器状态?】


    推荐阅读