本节将列举SystemTap中若干常用的数组操作。
使用=来设置给定键所对应的值,正如:
=
foo[tid()] = gettimeofday_s()
SystemTap会把tid()的结果作为一个键,并把gettimeofday_s()的结果赋给这个键。如果这个键已经存在foo中,原先关联的值会被覆盖掉。
tid()
gettimeofday_s()
foo
使用array_name[index_expression]可以获取对应键上的值。比如:
array_name[index_expression]
delta = gettimeofday_s() - foo[tid()]
如果数组中没有index_expression对应的键,默认情况下它会返回0(在数值计算中)或者空字符串(在字符串操作中)。
index_expression
使用++来增加对应键上的值,比如:array_name[index_expression] ++。在下面的例子里,每次vfs.read都会把当前进程名所关联的值加一:
++
array_name[index_expression] ++
vfs.read
probe vfs.read { reads[execname()] ++ }
你可以用if (index_expression in array_name)来判断数组是否有指定的键。
if (index_expression in array_name)
一旦已经收集了足够的信息到数组里,你往往需要去遍历它。正如上面的例子中,在收集了各个进程的读次数后,你可能需要遍历它,输出每个进程的结果。那该怎么做呢?
最好的方法就是使用foreach语句。看下这个例子:
foreach
global reads probe vfs.read { reads[execname()] ++ } probe timer.s(3) { foreach (count in reads) printf("%s : %d \n", count, reads[count]) }
在第二个探针中的foreach语句里,count引用了reads的键,所以可以通过reads[count]读取对应键所关联的值。
count
reads
reads[count]
在这个foreach语句里面,我们依次遍历reads的每个值。假如我们不想遍历整个数组,或者想指定遍历的顺序,该怎么做呢?你可以给数组名加个后缀+来表示按升序遍历,或-按降序遍历。另外,你可以用limit加一个数字来限制迭代的次数。 看下这个类似于上一个探针的例子:
+
-
limit
probe timer.s(3) { foreach (count in reads- limit 10) printf("%s : %d \n", count, reads[count]) }
上面的foreach语句会按关联的值降序遍历数组。limit 10表示foreach语句只会迭代10次(也即输出最高的10个值)。
limit 10
有时,你需要清除数组值某个值,或者清空整个数组以便于在另一个探针值重用。在之前统计vfs.read的例子里,每三秒统计一次各个进程的调用读操作的次数。如果要想统计三秒内各个进程的数据,需要每三秒清空一次数组。你可以使用delete运算符来删除数组中的某个元素,或整个数组。看下下面的例子:
delete
global reads probe vfs.read { reads[execname()] ++ } probe timer.s(3) { foreach (count in reads) printf("%s : %d \n", count, reads[count]) delete reads }
在上面的例子中,第二个探针仅输出三秒内每个进程的读次数。这里的delete语句清空了整个reads数组。
有时候你需要快速处理新的数值,并且数据量较大,这时候可以考虑使用聚集变量(aggregates),因为它实现了对数据的流式处理。聚集变量可以用作全局变量,也可以用作数组中的值。使用<<<运算符可以往聚集变量中添加新数据。
<<<
global reads probe vfs.read { reads[execname()] <<< $count }
假设在上面的例子中,$count的值是一段时间内当前进程的读次数。<<<会把$count的值存储到reads数组execname()关联的聚集变量中。请注意,我们是把值存储在聚集变量里面;它们既没有加到原来的值上,也没有覆盖掉原来的值。可以这么说,就像是reads数组值每个键都有多个关联的值,并且探针的每次触发都会添加新的值。
$count
execname()
要想从聚集变量中获取汇总的结果,使用这样的语法@extractor(variable/array index expression)。extractor可以取以下的函数:
@extractor(variable/array index expression)
extractor
返回variable/array index expression中存储的数值的数目。以上面为例,@count(reads[execname()])返回对应进程的聚集变量所存储的数据数。
variable/array index expression
@count(reads[execname()])
sum
返回variable/array index expression中存储的数值的和。以上面为例,@count(reads[execname()])返回对应进程的读总数。
min
返回variable/array index expression中存储的数值的最小值。
max
返回variable/array index expression中存储的数值的最大值。
avg
返回variable/array index expression中存储的数值的数目。
你可以使用多重索引表达式在数组里关联一个聚集变量(最多使用9个索引)。这么做的好处在于,你可以在数组中附加更多的上下文信息。举个例子:
global reads probe vfs.read { reads[execname(),pid()] <<< 1 } probe timer.s(3) { foreach([var1,var2] in reads) printf("%s (%d) : %d \n", var1, var2, @count(reads[var1,var2])) }
在上面的例子中,第一个探针记录每个进程的vfs.read次数。跟之前的例子不同的是,这里的数组同时使用进程名和PID作为索引。
在第二个探针里,我们使用foreach语句遍历并输出每个进程的数据。注意这里我们分别使用var1和var2来引用进程名和PID。
var1
var2
Copyright© 2013-2020
All Rights Reserved 京ICP备2023019179号-8