神器BTrace快速入门
1.使用背景
生产环境系统发生问题时,定位问题需要获取系统运行时的相关数据,如方法参数、返回值、全局变量、堆栈信息等。为了获取这些数据,需要修改代码,将数据输出到日志文件,再发布到生产环境。这种方式,一方面将增大定位问题的成本和周期,对于紧急问题无法做到及时定位及解决;另一方面重新部署后环境很大程度上已被破坏,很难重现问题。BTrace在这种背景环境下应运而生了。
2.BTrace简述
Btrace (Byte Trace)是sun推出的一款Java 动态、安全追踪(监控)工具,可以在不停机的情况下监控系统运行情况,并且做到最少的侵入,占用最少的系统资源。官方网址:https://kenai.com/projects/btrace。BTrace在使用上做了很多限制,如不能创建对象、不能使用数组、不能抛出或捕获异常、不能使用循环、不能使用synchronized关键字、脚本的属性和方法都必须使用static修饰等,具体限制条件可参考用户手册。根据官方声明,不当地使用BTrace可能导致JVM崩溃,如BTrace使用错误的.class文件,所以,可以先在本地验证BTrace脚本的正确性再使用。
3.BTrace优点
安全性:安全性不会导致对目标Java进程的任何破坏性影响;
无侵入性:无需对原有代码做任何修改,降低上线风险和测试成本,并且无需重启系统。
4.安装BTrace
1)下载地址:https://github.com/btraceio/btrace/releases/tag/v1.3.8.3-1
2)解压缩
3)设置环境变量
BTRACE_HOME=/Users/wlxs/btrace-bin-1.3.8.3
export BTRACE_HOME
export PATH=$PATH:$BTRACE_HOME/bin
5.使用btrace
作用:运行Btrace脚本
命令格式:
Paste_Image.png
参数说明:
Paste_Image.png
6.使用btracec
�作用:预编译BTrace脚本,在编译期验证脚本正确性。
�命令格式:
参数说明:directory指定编译结果输出路径,其它参数同btrace。
7.使用btracer
�作用:btracer命令同时启动应用程序和BTrace脚本
�命令格式:
参数说明:
Paste_Image.png8.注解说明
1)类注解
�@com.sun.btrace.annotations.BTrace指定该java类为一个btrace脚本文件。
2)属性注解
�@TLS标注的属性可以在追踪脚本的方法中通讯
3)方法注解
�@OnMethod:指定该方法在什么情况下被执行,clazz属性指定要跟踪的类的全限定类名,也可以用正则表达式,“/类名的Pattern/”匹配,如/javax\\.swing\\..*/;用”+类名”追踪所有子类,如+java.lang.Runnable;用”@xxx”追踪用该注解注解过的类,如@javax.jws.WebService。method属性指定要追踪的方法名称,也可以用正则表达式。location属性用@Location来指定该方法在目标方法执行前(后、异常、某行、某个方法调用)被执行�。
@OnTimer:定时执行该方法�。
@OnExit:当脚本运行Sys.exit(code)时执行该方法�。
@OnError:当脚本运行抛出异常时执行该方法�。
@OnEvent:脚本运行时Ctrl+C可以发送事件�。
@OnLowMemory:指定一个内存阀值,低于阀值值执行该方法�。
@OnProbe:指定一个xml文件来描述在什么时候执行该方法。
4)方法参数注解
�@Self:指目标对象本身�。
@Retrun:指目标程序方法返回值(需要配合Kind.RETURN)�。
@ProbeClassName:指目标类名。
�@ProbeMethodName:指目标方法名�。
@targetInstance:指@Location指定的clazz和method的目标(需要配合Kind.CALL)�。
@targetMethodOrField:指@Location指定的clazz和method的目标的方法或字段(需要配合Kind.CALL)�。
@Duration:指目标方法执行时间,单位是纳秒(需要需要配合Kind.RETURN或Kind.ERROR一起使用)。
�AnyType:获取对应请求的参数,泛指任意类型。
9.追踪时机参数
�Kind.Entry:开始进入目标方法时,默认值�。
Kind.Return:目标方法返回时。
�Kind.Error:异常没被捕获被抛出目标方法之外时�。
Kind.Throw:异常抛出时�。
Kind.Catch:异常被捕获时。
�Kind.Call:被调用时。
�Kind.Line:执行到某行时。
10.其它
�1)追踪构造函数�:@OnMethod(clazz="java.net.ServerSocket",method="<init>”)。
�2)追踪静态内部类:�在类与内部类之间加上"$",�示例如@OnMethod(clazz="com.vip.MyServer$MyInnerClass", method="hello”)�。
3)追踪同名函数:�如果有多个同名的函数,可以在拦截函数上定义不同的参数列表�。
4)追踪结果输出�可以使用>将结果输出到指定文件。
11.示例代码
Calculator类的add方法每隔5秒对a、b两个数进行相加,代码如下。
public class Calculator {
private int c = 1;
public int add(int a, int b) {
try {
Thread.sleep(5000);
} catch (InterruptedException e) {
e.printStackTrace();
}
return a + b;
}
}
BTraceDemo调用Calculator的add方法对两个随机数进行相加,代码如下。
public class BTraceDemo {
public static void main(String[] args) {
Calculator calculator = new Calculator();
Random random = new Random();
while (true) {
System.out.println(calculator.add(random.nextInt(10), random.nextInt(10)));
}
}
}
1)BTraceTest则是相应的追踪脚本,代码如下。
@BTrace
public class BTraceTest {
private static long count;
static{
println("---------------------------JVM properties:---------------------------");
printVmArguments();
println("---------------------------System properties:------------------------");
printProperties();
println("---------------------------OS properties:----------------------------");
printEnv();
exit();
}
@OnMethod(
clazz = "Calculator",
method = "add",
location = @Location(Kind.RETURN)
)
public static void trace1(int a, int b, @Return int sum) {
println("trace1:a=" + a + ",b=" + b + ",sum=" + sum);
}
}
运行如下命令:
btrace 11308 /Users/wlxs/java/BTraceTest.java
11308是BTraceDemo的进程ID,静态块中的输出结果就不展示了。trace1方法实现对Calculator类的add方法的入参和返回值进行追踪,结果如下。
trace1:a=2,b=6,sum=8
2)为了节省篇幅,下面都将只列出各个追踪的方法,trace2追踪Calculator类的add方法执行时间,默认时间单位是纳秒。
@OnMethod(
clazz = "Calculator",
method = "add",
location = @Location(Kind.RETURN)
)
public static void trace2(@Duration long duration) {
println(strcat("duration(nanos): ", str(duration)));
println(strcat("duration(s): ", str(duration / 1000000000)));
}
结果如下。
duration(nanos): 5004187000
duration(s): 5
3)trace3追踪Calculator类的add方法,并且追踪add方法中的任何类的sleep方法,代码如下。
@OnMethod(
clazz = "Calculator",
method = "add",
location = @Location(value = Kind.CALL, clazz = "/.*/", method = "sleep")
)
public static void trace3(@ProbeClassName String pcm, @ProbeMethodName String pmn,
@TargetInstance Object instance, @TargetMethodOrField String method) {
println(strcat("ProbeClassName: ", pcm));
println(strcat("ProbeMethodName: ", pmn));
println(strcat("TargetInstance: ", str(instance)));
println(strcat("TargetMethodOrField : ", str(method)));
println(strcat("count: ", str(++count)));
}
结果如下。
ProbeClassName: Calculator
ProbeMethodName: add
TargetInstance: null
TargetMethodOrField : sleep
count: 1
4)trace4每隔6秒打印一次count的值,代码如下。
@OnTimer(6000)
public static void trace4() {
println(strcat("trace4:count: ", str(count)));
}
结果如下。
trace4:count: 1
5)trace5用于获取Calculator类的c属性的值,代码如下。
@OnMethod(
clazz = "Calculator",
method = "add",
location = @Location(Kind.RETURN)
)
public static void trace5(@Self Object calculator) {
println(get(field("Calculator", "c"), calculator));
}
6)traceMemory每隔4秒打印一次印堆和非堆内存信息,代码如下。
@OnTimer(4000)
public static void traceMemory() {
println("heap:");
println(heapUsage());
println("no-heap:");
println(nonHeapUsage());
}
结果如下。
heap:
init = 10485760(10240K) used = 4430576(4326K) committed = 9961472(9728K) max = 9961472(9728K)
no-heap:
init = 24576000(24000K) used = 7813992(7630K) committed = 24576000(24000K) max = 136314880(133120K)
7)trace6每隔4秒检测是否有死锁产生,并打印产生死锁的相关类信息、对应的代码行、线程信息,代码如下。
@OnTimer(4000)
public static void trace6() {
deadlocks();
}