带你了解Java Agent

Java Agent这个技术,对于大多数同窗来讲都比较陌生,可是多多少少又接触过,实际上,咱们平时用的不少工具,都是基于Java Agent实现的,例如常见的热部署JRebel,各类线上诊断工具(btrace, greys),还有阿里最近开源的arthas。java

其实Java Agent一点都不神秘,也是一个Jar包,只是启动方式和普通Jar包有所不一样,对于普通的Jar包,经过指定类的main函数进行启动,可是Java Agent并不能单独启动,必须依附在一个Java应用程序运行,有点像寄生虫的感受。api

如何动手写一个Java Agent

由于Java Agent的特殊性,须要一些特殊的配置,在META-INF目录下建立MANIFEST文件.socket

并在MANIFEST文件中指定Agent的启动类maven

这里须要解释下为何要指定 Agent-Class 和 Premain-Class ,在加载Java Agent以后,会找到 Agent-Class 或者 Premain-Class 指定的类,并运行对应的 agentmain 或者 premain 方法。函数

/**
 * 以vm参数的方式载入,在Java程序的main方法执行以前执行
 */
public static void premain(String agentArgs, Instrumentation inst);

/**
 * 以Attach的方式载入,在Java程序启动后执行
 */
public static void agentmain(String agentArgs, Instrumentation inst);

若是不想手动建立MANIFEST文件,也能够经过Maven配置,在打包的时候自动生成,具体配置能够参数下面。工具

<plugin>
    <artifactId>maven-assembly-plugin</artifactId>
    <configuration>
        <archive>
            <manifestEntries>
                <Premain-Class>com.dianping.rhino.agent.AgentBoot</Premain-Class>
                <Agent-Class>com.dianping.rhino.agent.AgentBoot</Agent-Class>
                <Can-Redefine-Classes>true</Can-Redefine-Classes>
                <Can-Retransform-Classes>true</Can-Retransform-Classes>
            </manifestEntries>
        </archive>
    </configuration>
</plugin>

因此,咱们须要在 agentmain 或者 premain 方法中实现具体的Agent逻辑,这里是你大显身手的地方,读取JVM的各类数据,修改类的字节码,只要你能想到的,通常均可以实现。spa

如何加载 Java Agent

前面说了,一个Java Agent既能够在程序运行前加载,也能够在程序运行后加载,二者有什么区别呢?命令行

程序运行前加载

经过JVM参数 -javaagent:**.jar 启动,程序启动的时候,会优先加载Java Agent,并执行其 premain 方法,这个时候,其实大部分的类都尚未被加载,这个时候能够实现对新加载的类进行字节码修改,可是若是 premain 方法执行失败或抛出异常,那么JVM会被停止,这是很致命的问题。code

程序运行后加载

程序启动以后,经过某种特定的手段加载Java Agent,这个特定的手段就是 VirtualMachine的 attach api ,这个api实际上是JVM进程之间的的沟通桥梁,底层经过socket进行通讯,JVM A能够发送一些指令给JVM B,B收到指令以后,能够执行对应的逻辑,好比在命令行中常常使用的jstack、jcmd、jps等,不少都是基于这种机制实现的。orm

由于是进程间通讯,因此使用 attach api 的也是一个独立的Java进程,下面是一个简单的实现。

// 15186表示目标进程的PID
VirtualMachine vm = VirtualMachine.attach("15186");  
try {
   // 指定Java Agent的jar包路径
    vm.loadAgent(".../agent.jar");    
} finally {
    vm.detach();
}

首先,咱们得知道目标进程的PID,这个能够经过jps指令方便获得,也能够经过 VirtualMachine 的list方法拿到本机全部Java进程的PID。经过 attach 链接上目标PID以后,能够得到表示目标进程的vm对象,执行 loadAgent 方法,对应的Java Agent会被加载,而后会找到指定的入口类,并执行agentmain方法,若是执行出现普通异常(除了oom和其它致命异常),目标JVM并不会受到影响。

经过这种方式,能够实现动态的加载Java Agent,而不须要修改JVM启动参数。

相关文章
相关标签/搜索