伤城文章网 > IT/计算机 > UNIX操作系统监控及分析

UNIX操作系统监控及分析


专题培训

UNIX操作系统监控 及分析

UNIX操作系统监控及分析
UNIX主机资源监控及分析

?操作系统( IBM-AIX、HP-UX、LINUX ) ?监控分析工具 ?资源瓶颈典型症状

UNIX操作系统监控
一般性能分析过程
Topas Nmon glance vmstat sar Y CPU瓶颈? N Y 内存瓶颈? N I/O瓶颈? N Y iostat lslv filemon fileplace

Topas Nmon glance vmstat lsps svmon

netstat nfsstat
nfso no ifconfig netpmon Y 网络瓶颈? N More test

UNIX操作系统监控及分析
IBM-AIX性能监控工具
CPU vmstat, iostat topas/nmon ps 内存 vmstat topas/nmon ps 磁盘 iostat topas/nmon lvmstat,iostat -d

sar time/timex
netpmon trace,trcrpt

svmon lsps
filemon trace,trcrpttrace,trcrpt

lvmstat lsps
filemon

UNIX操作系统监控及分析
?监视CPU使用情况:vmstat

?r :运行队列中的内核线程数 ?b :等待队列中(等待系统资源、等待I/O)的内核线程数

UNIX操作系统监控及分析
?监视CPU使用情况:sar

?可以监控每个CPU的资源使用情况
?%usr: CPU执行应用(user)进程的时间百分比 ?%sys:CPU 执行内核(system)进程的时间百分比 ?%idle:CPU 空闲百分比 ?%wio:CPU等待 I/O百分比

UNIX操作系统监控及分析
?监视进程占用CPU情况 ?查看前三位占用CPU的进程 ps -aux | head -4

%CPU :表示进程使用cpu时间的百分比 %MEM :表示进程使用实际内存的百分比

UNIX操作系统监控及分析
?监视内存使用情况:vmstat

? avm = 活动的虚拟页面 ? fre = 空闲的页面 ? pi = 从paging space调入内存的页面数

? po = 从内存调入paging space的页面数
? fr = 被释放的页面数 ? sr = 页面替换算法扫描的页面数

UNIX操作系统监控及分析
?监视内存使用情况:svmon

?-G 显示整个系统中实际内存和分页使用情况 ?-U 查看用户的内存使用情况 ?-C 统计命令的内存使用情况

?-P 统计进程使用的内存情况。加[PID]可以查看单个进程的内存使用情况

UNIX操作系统监控及分析
?监视进程占用内存情况:svmon

? 查看前三个占用内存的进程
svmon -Pt 3 ? 查看进程所使用的文件 svmon –pP [PID] ? 使用交换区最多的三个进程 svmon -gP -t 3|grep -p Pid|grep '^.*[0-9] '

UNIX操作系统监控及分析
?监视pagespces使用率 lsps –a

用来检测系统中所有页空间的分布配置和使用情况,包括页空间的容量使 用率等。 %used > 70% 内存将成瓶颈

UNIX操作系统监控及分析
?监视I/O使用情况:iostat

?% tm_act:表示某个磁盘处于active状态的百分比 ?tps : 表示每秒某个硬盘有多少个数据传输次数 ?Kb_read /Kb_wrtn — 分别显示从开机到运行iostat这个命令这段时间内对硬盘的read和 write的总数据量,单位kb

UNIX操作系统监控及分析
?监视I/O使用情况:iostat
?如果%idle数值都很高而且%iowait数值也很高,大于25,这个说明系
统存在I/O或 则硬盘瓶颈 ?高数值的%iowait有可能下面几个原因: 1. 内存不够而引起频繁的swap空间的数据交换,导致数据存取存在 交换空间的 I/O瓶颈 2. 3. 硬盘上面数据不合理的分布 数据的fragment不合理

UNIX操作系统监控及分析
?监视I/O使用情况:sar -d

device: sar命令正在监视的块设备的名字。 %busy: 设备忙时,传送请求所占时间的百分比。 avque: 队列站满时,未完成请求数量的平均值。 r+w/s: 每秒传送到设备或从设备传出的数据量。 blks/s: 每秒传送的块数,每块512字节。 avwait: 队列占满时传送请求等待队列空闲的平均时间。 avserv: 完成传送请求所需平均时间(毫秒)。

UNIX操作系统监控及分析
?监视进程占用I/O情况:topas -P

?topas 可以查看每个进程所占的IO

UNIX操作系统监控及分析
?topas从整体监控:

UNIX操作系统监控及分析
?topas从整体监控:

?CPU相关项
? Kerne%:表示内核程序占用CPU的百分数 ? User%:表示用户程序占用CPU的百分数

? Wait%:表示CPU等待I/O所花费时间的百分数
? Idle%:表示CPU空闲时间的百分数

UNIX操作系统监控及分析
?topas从整体监控:

?Memory 相关项
? %Comp:表示当前分配给计算分页片断的内存占实际 内存的百分比 ? %Noncomp:表示当前分配非计算分页片断的内存占实际 内存的百分比 ? %Client:表示当前分配给用来缓冲远程挂载文件的内存 占实际内存的百分比

UNIX操作系统监控及分析
?topas从整体监控: ?PAING SPACE相关项 ?Size,MB:表示系统里所有分页空间大小,以MB为单位

?%Used: 表示当前使用的分页空间占总空间的百分比
?%Free: 表示当前空闲的分页空间占总空间的百分比 ?PAING相关项

?PageIn: 在监控期间每秒钟读取的4k分页数
?PageOut:在监控期间每秒钟写入的4k分页数

UNIX操作系统监控及分析
?topas从整体监控: ?Disk相关项 ?Disk: ?KBPS: ?TPS: 物理磁盘的名称

?Busy%: 指明物理磁盘在活动状态的时间百分比
在监控期间每秒钟读写的K字节总数 每秒钟物理磁盘的数据传输量,一次传输指的

是一次I/O请求
?KB-Read: 每秒钟从物理磁盘读出的K字节数 ?KB-Write:每秒钟向物理磁盘写入的K字节数

UNIX操作系统监控及分析
?topas从整体监控: ?Process相关项 ?NAME:可执行程序的名称 ?Process ID:进程的ID号 ?CPU%:进程的CPU平均使用率 ?Paging Space Used:分配给进程的分页空间大小 ?Process Owner: 拥有这个进程的用户名

UNIX操作系统监控及分析
?topas从整体监控: ?CPU项的Wait%: 如果Idle%数值很高而且Wait%数值也很高(Wait%大于25),

这个说明系统存在内存或者硬盘I/O瓶颈。
?高数值的Wait%可能发生的原因: 1、内存不够而引起频繁的swap空间的数据交换,导致数据存取存在 交换空间的I/O瓶颈。 2、硬盘上面数据不合理的分布。 3、应用程序存在过于频繁的I/O操作。

UNIX操作系统监控及分析
?topas从整体监控: ? CPU项的Kernel%和User%:

如果Kernel%和User%项的数值之和大于85%,特别是User%
的数值很高,表示系统CPU使用率太高,存在CPU资源瓶颈。 ? 高数值的Kernel%和User%可能发生的原因:

应用程序存在耗用CPU过高的进程,需优化解决。
负载压力过大,CPU资源不足,需增加CPU个数。

UNIX操作系统监控及分析
?topas从整体监控: ?PAING项的PageIn和PageOut: 如果PageIn和PageOut项的数值持续大于0,并且数值较高,

表示系统换页过于频繁,系统内存不足,存在内存资源瓶颈。
?高数值的PageIn和PageOut项可能发生的原因: 1、应用程序存在耗用内存过高的进程,需优化解决。

2、负载压力过大,内存资源不足,需增加内存个数。

UNIX操作系统监控及分析
?监控工具:Nmon

?Nmon安装
1. 将 NmonXXX.tar.gz 文件复制到计算机。如果使用 FTP,请记住 使用二进制模式 2. 解压该文件,运行运行 gzip -d nmonXXX.tar.gz 3. 提取该文件,运行tar xvf nmonXXX.tar ? Nmon部署 1. 解压nmon后运行chomd +x nmon 2. 设置环境变量 3. 进入nmon安装目录运行nmon

UNIX操作系统监控及分析
?监控工具:nmon

?Nmon 实时监控

UNIX操作系统监控及分析
?监控工具:Nmon

?Nmon实时监控
在nmon显示页面,依次输入c,m,d

UNIX操作系统监控及分析
?Nmon实时监控 ?Nmon 运行时键盘输入命令

命令 c m d t P k

说明
提供关于物理CPU使用的详细信息 提供内存使用的详细信息:系统(内核)和进程,活动虚拟内 存 提供关于磁盘,磁盘类型大小,可用空间,卷组,适配器等更 详细的信息 当前进程详细情况 Paging space 使用情况 显示内核信息

UNIX操作系统监控及分析
?Nmon收集数据
?操作步骤: 1. 写nmon.sh脚本 nmon -f -s 60 -c 30(每60s收集一次数据,共收集30次) 2. Nmon.sh赋予执行权限 3. 执行nmon.sh 4. 使用分析工具nmon analyser.xls 打开*.nmon

UNIX操作系统监控及分析
HP-UX监控分析工具 ?Top ?vmstat

?swapinfo
?Iostat ?Glance

UNIX操作系统监控及分析
?监视CPU使用情况:top

UNIX操作系统监控及分析
?监视CPU使用情况:sar

%usr:CPU执行应用(user)进程的时间百分比 %sys:CPU 执行内核(system)进程的时间百分比 %idle:CPU 空闲百分比 %wio:CPU等待是 I/O百分比 %usr + %sys应小于 85%,大于表明可能是CPU性能问题。 %wio应小于30%,大于表明可能是 I/O 性能问题。

UNIX操作系统监控及分析
?监视内存使用情况:swapinfo

?reserve 保留的分页空间 ?memory 内存分页区

UNIX操作系统监控及分析
?监视I/O使用情况:iostat

device: iostat统计的设备名称。 bps: 每秒该设备传输的K字节数。 sps: 每秒检索该设备次数。 msps: 平均每次检索所花费的时间,单位毫秒。

UNIX操作系统监控及分析
?Glance实时监控

UNIX操作系统监控及分析
?Glance实时监控
?Glance运行时键盘输入命令

UNIX操作系统监控及分析
?Glance收集数据
?操作步骤: 1. 把需要监控的指标写到一个控制脚本adviser.syntax中,如:
PRINT GBL_STATDATE," ",GBL_STATTIME, ―CPU_UTIL‖," ",GBL_CPU_TOTAL_UTIL, " CPU_RUN_QUEUE", " ", GBL_RUN_QUEUE, " ACTIVE_CPU"," ", GBL_ACTIVE_CPU

2. 写glance.sh脚本
glance -j 10 -adviser_only -bootup -iterations 60 -syntax adviser.syntax>> `hostname`_glance_`date +%Y%m%d`.log

3. 4.

glance.sh赋予执行权限
Chmod+x glance.sh

后台运行nohup ./glance.sh &

UNIX操作系统监控及分析
?LINUX监控分析工具 ?Top ?vmstat

?free
?Iostat ?Nmon

UNIX操作系统监控及分析
?CPU 成为瓶颈典型症状: ? 系统响应时间较慢 ? CPU空闲率较少 ? 过高的用户占用CPU时间 ? 过高的系统占用CPU时间 ? 长时间有很长的运行队列

UNIX操作系统监控及分析
?内存成为瓶颈典型症状: ? 很高的换页率 ? 进程进入不活动状态 ? 很长的运行队列,但CPU空闲较多 ? 内存不够出错( out of memory errors )

UNIX操作系统监控及分析
?I/O成为瓶颈典型症状: ? 过高的磁盘利用率 ? 太长的磁盘等待队列 ? 等待磁盘I/O的时间所占的百分率太高 ? 过低的缓冲命中率 ? 太长的运行进程队列,但CPU空闲




搜索更多“UNIX操作系统监控及分析”

网站地图

All rights reserved Powered by 伤城文章网 5xts.com

copyright ©right 2010-2021。
伤城文章网内容来自网络,如有侵犯请联系客服。zhit325@126.com