Linux系统出现了性能问题,一般我们可以通过top、iostat、free、vmstat等命令 来查看初步定位问题。其中iostat可以给我们提供丰富的IO状态数据。
1. 基本使用
参数 -d 表示,显示设备(磁盘)使用状态;-k某些使用block为单位的列强制使用Kilobytes为单位;1 10表示,数据显示每隔1秒刷新一次,共显示10次。
tps:该设备每秒的传输次数(Indicate the number of transfers per second that were issued to the device.)。“一次传输”意思是“一次I/O请求”。多个逻辑请求可能会被合并为“一次I/O请求”。“一次传输”请求的大小是未知的。
kB_read/s:每秒从设备(drive expressed)读取的数据量;kB_wrtn/s:每秒向设备(drive expressed)写入的数据量;kB_read:读取的总数据量;kB_wrtn:写入 的总数量数据量;这些单位都为Kilobytes。
上面的例子中,我们可以看到磁盘sda以及它的各个分区的统计数据,当时统计的磁盘总TPS是39.29,下面是各个分区的TPS。(因为是瞬间 值,所以总TPS并不严格等于各个分区TPS的总和)
2. -x 参数
使用-x参数我们可以获得更多统计信息。
rrqm/s:每秒这个设备相关的读取请求有多少被Merge了(当系统调用需要读取数据的 时候,VFS将请求发到各个FS,如果FS发现不同的读取请求读取的是相同Block的数据,FS会将这个请求合并Merge);wrqm/s:每秒这个 设备相关的写入请求有多少被Merge了。
rsec/s:每秒读取的扇区数;wsec/: 每秒写入的扇区数。r/s:The number of read requests that were issued to the device per second;w/s:The number of write requests that were issued to the device per second;
await:每一个IO请求的处理的平均时间(单位是微秒)。这里可以理解为IO的响应时 间,一般地系统IO响应时间应该低于5ms,如果大于10ms就比较大了。
%util:在统计时间内所有处理IO时间,除以总共统计时间。例如,如果统计间隔1秒,该 设备有0.8秒在处理IO,而0.2秒闲置,那么该设备的%util = 0.8/1 = 80%,所以该参数暗示了设备的繁忙程度。一般地,如果该参数是100%表示设备已经接近满负荷运行了(当然如果是多磁盘,即使%util是100%,因 为磁盘的并发能力,所以磁盘使用未必就到了瓶颈)。
3. -c 参数
iostat还可以用来获取cpu部分状态值:
4. 常见用法
5. 实例分析
上面看到,磁盘每秒传输次数平均约400;每秒磁盘读取约5MB,写入约1MB。
可以看到磁盘的平均响应时间<5ms,磁盘使用率>80。磁盘响应正常,但是已经很繁忙了。
参考文献:
- Linux man iostat
- How Linux iostat computes its results
- Linux iostat
最近要对分布式集群做一些性能测试,其中一个很重要的项就是测试hadoop分布式集群在支持多磁盘轮转 写入的时候在各种磁盘配置的情况下的读写性能,如 在RAID0,RAID5和JBOD情况下的磁盘性能,所以linux 下的iostat命令就在产生report的脚本中非常有用,特此记录下iostat命令的一些使用笔 记 :
[命令:] iostat [-c|-d] [-k] [-t] [间隔描述] [检测次数] 参 数: -c : 仅显示cpu的状态 -d : 仅显示存储设备的状态,不可以和-c一起使用 -k : 默认显示的是读入读出的block信息,用-k可以改成KB大小来显示 -t : 显示日期 -p device | ALL : device为某个设备或者某个分区,如果使用ALL,就表示要显示所有分区和设备的信息 显示示例: avg-cpu: %user %nice %sys %iowait %idle 4.55 0.00 0.63 0.26 94.56 Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn cciss/c0d0 30.11 68.20 67.13 1232784060 1213452142 cciss/c0d0p1 0.00 0.00 0.00 2531 2 cciss/c0d0p2 83.78 68.18 67.11 1232572011 1213204536 dm-0 1.06 0.60 4.07 10873201 73555720 dm-1 82.50 67.42 62.23 1218704309 1124966656 dm-2 0.21 0.18 0.83 3199605 14929540 dm-3 0.00 0.00 0.00 372 224 以上显示分为上下两个部 分,上半部分显示CPU的信息,下面的数 据 显示存储设备的相关数据,它的数据意义如下: tps:平均每秒钟的传送次数,与数据传输“次数”相关,非容 量 kB_read/s:启动到现在的平均读取单位 kB_wrtn/s:启动到现在的平均写入单位 kB_read:启动到现在总共 读出来的文件 单位 kB_wrtn: 启动到现在总共写入的文件单位 如果想要对iostat检查多此,每次之间的间隔一定数量的秒数,这样就可以查看每几秒钟之内的io统计数 据,这对性能的测试才具有实际意义: $> iostat -d 2 3 表示没量秒钟检查一次,一共检查三次 avg-cpu: %user %nice %sys %iowait %idle 4.55 0.00 0.63 0.26 94.56 Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn cciss/c0d0 30.11 68.20 67.13 1232900288 1213456210 cciss/c0d0p1 0.00 0.00 0.00 2531 2 cciss/c0d0p2 83.78 68.19 67.11 1232688239 1213208604 dm-0 1.06 0.60 4.07 10873201 73558008 dm-1 82.50 67.42 62.23 1218820537 1124967604 dm-2 0.21 0.18 0.83 3199605 14930372 dm-3 0.00 0.00 0.00 372 224 avg-cpu: %user %nice %sys %iowait %idle 0.00 0.00 0.63 0.00 99.37 Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn cciss/c0d0 1.02 0.00 63.27 0 124 cciss/c0d0p1 0.00 0.00 0.00 0 0 cciss/c0d0p2 15.82 0.00 63.27 0 124 dm-0 15.82 0.00 63.27 0 124 dm-1 0.00 0.00 0.00 0 0 dm-2 0.00 0.00 0.00 0 0 dm-3 0.00 0.00 0.00 0 0 avg-cpu: %user %nice %sys %iowait %idle 0.00 0.00 0.32 0.00 99.68 Device: tps kB_read/s kB_wrtn/s kB_read kB_wrtn cciss/c0d0 3.06 0.00 26.53 0 52 cciss/c0d0p1 0.00 0.00 0.00 0 0 cciss/c0d0p2 6.63 0.00 26.53 0 52 dm-0 0.00 0.00 0.00 0 0 dm-1 6.63 0.00 26.53 0 52 dm-2 0.00 0.00 0.00 0 0 dm-3 0.00 0.00 0.00 0 0 其中每一次的统计都是上 一次的统计时间到这次的统计时间之间的统计数据