JVM中Instrumentation实现

jopen 10年前

想必不少人听说过javaagent,但是很少人听说Instrumentation,其实Instrumentation就是javaagent 的实现机制,说到Instrumentation,就必须想了解java的attach机制,那就先说下attach的实现。
JVM中Instrumentation实现
大家进行jstack的时候,是不是经常看到两个线程Signal Dispatcher和Attach Listener线程,可能不知道是干嘛的吧,这两个线程是实现attach的关键所在,其中前者是在jvm启动的时候就会创建的,后者只有接收过attach请求的时候vm才会创建,顾名思义,Signal Dispatcher是分发信号的,Attach Listener 是处理attach请求的,那么两者有什么关系呢,当我们执行attach方法的时候,会向目标vm发出一个SIGQUIT 的信号,目标vm收到这个信号之后就会创建Attach Listener线程了,当然jvm保证了不会多创建。

Attach机制说得简单点就是提供A进程可以连上B进程(当然是java进程),创建socket进行通信,A通过发命令给B,B然后对命令进行 截取从自己的vm中获取信息发回给客户端vm,但是并不是随便发指令都会处理的,那么attach Listener接收哪些命令呢,如下所示:

static AttachOperationFunctionInfo funcs[] = {     { "agentProperties",  get_agent_properties },     { "datadump",         data_dump },     { "dumpheap",         dump_heap },     { "load",             JvmtiExport::load_agent_library },     { "properties",       get_system_properties },     { "threaddump",       thread_dump },     { "inspectheap",      heap_inspection },     { "setflag",          set_flag },     { "printflag",        print_flag },     { "jcmd",             jcmd },     { NULL,               NULL }   };

Instrumentation的实现其实主要使用了load这个指令,它用来实现让target vm动态加载agentlib,Instrumentation的实现在一个名为libinstrument.dylib的动态lib库,linux下是libinstrument.so,它是基于JVMTI接口实现的,因此在对其进行load的时候会创建一个agent实例,并往JVMTI环境注册一些回调方法,比如监听类文件加载的事件,vm初始化完成事件等,执行Agent_OnAttach,这里会创建一个Instrumentation实例并返回给用户供大家扩展Instrumentation,比如增加一些transform,并会执行Instrumentation实例的loadClassAndCallAgentmain方法,该方法主要执行agent的MF文件里定义的 Agent-Class类的agentmain方法,当vm初始化完毕之后,会调用loadClassAndCallPremain方法,该方法主要执行agent的MF文件里定义的Agent-Class类的premain方法。在类进行加载的时候会调用Instrumentation的transform方法,可以看看参数里有个byte数组,这个数组其实就是正在加载的class字节码,所以如果要字节码增强在这里就可以入手啦,甚至可以实现偷天换日。

如果在vm启动过程中加载agent,那么会在vm初始化过程中先执行libinstrument.dylib里InvocationAdapter.c的Agent_OnLoad方法,该方法主要:实例化agent,解析agent的MF文件,将相关属性取出来,并注册JVMTI的一些回调函数,在vm初始化完成之后,会通过回调函数去实例化Instrumentation实现对象,设置ClassFileLoadHook函数,并调用Pre-Main指定类的premain方法。

如果在运行期通过attach api来load agent,那么会在收到load指令之后,会调用InvocationAdapter.c的Agent_OnAttach方法,其实现基本和Agent_OnLoad一致,只是会调用Agent-Class的agentmain方法,还有点不同就是对vm init事件没有再关注(都运行期了,关注也没用),而是直接对ClassFileLoad关注,也不会再调用Pre-Main指定的类的premain 方法(顾名思义,是在执行main方法之前执行的,所以运行期搞执行Pre-Main的class也不妥)。
来自:http://my.oschina.net/xianggao/blog/364494