1、Javaagentjava
Javaagent至关于一个插件,在JVM启动的时候能够添加 javaagent配置指定启动以前须要启动的agent jar包
这个agent包中须要有MANIFEST.MF文件必须指定Premain-Class配置,且Premain-Class配置指定的Class必须实现premain()方法编程
在JVM启动的时候,会从agent包中找到MAINIFEST.MF中配置的Class,执行其实现的premain方法,并且这一步是在main方法以前执行的。
这样就能够在JVM启动执行main方法以前作一些其余而外的操做了。数组
premain方法有两种网络
public static void premain(String agentArgs, Instrumentation inst){ //执行main方法以前的操做 } public static void premain(String agentArgs){ //执行main方法以前的操做 }
agent会优先执行第一个方法,若是第二个方法不存在则才会执行第二个方法。app
javaagent使用的步骤主要以下:jvm
一、新建agent项目,新建自定义agent的入口类,以下socket
1 public class MyAgent 2 { 3 /** 4 * 参数args是启动参数 5 * 参数inst是JVM启动时传入的Instrumentation实现 6 * */ 7 public static void premain(String args,Instrumentation inst) 8 { 9 System.out.println("premain方法会在main方法以前执行......");11 } 12 }
二、编辑MANIFEST.MF文件,内容以下:ide
Mainfest-version: 1.0 Premain-class: cn.lucky.test.agent.MyAgent
三、将agent项目打包成自定义的名字,如 myagent.jar函数
四、在目标项目启动的时候添加JVM参数工具
-javaagent: myagent.jar
简单的四步就实现了一个自定义的javaagent,agent的具体实现功能就看自定义的时候如何实现premain(),能够premain方法中添加任何想要在main方法执行以前的逻辑。
premain方法中有一个参数,Instrumentation,这个是才是agent实现更强大的功能都核心所在
Instrumentation接口位于jdk1.6包java.lang.instrument包下,Instrumentation指的是能够独立于应用程序以外的代理程序,能够用来监控和扩展JVM上运行的应用程序,至关因而JVM层面的AOP
功能:
监控和扩展JVM上的运行程序,替换和修改java类定义,提供一套代理机制,支持独立于JVM应用程序以外的程序以代理的方式链接和访问JVM。
好比说一个Java程序在JVM上运行,这时若是须要监控JVM的状态,除了使用JDK自带的jps等命令以外,就能够经过instrument来更直观的获取JVM的运行状况;
或者一个Java方法在JVM中执行,若是我想获取这个方法的执行时间又不想改代码,经常使用的作法是经过Spring的AOP来实现,而AOP经过面向切面编程,实际上编译出来的类中代码也是被改动的,而instrument是在JVM层面上直接改动java方法来实现
源码以下:
1 public interface Instrumentation 2 { 3 //添加ClassFileTransformer 4 void addTransformer(ClassFileTransformer transformer, boolean canRetransform); 5 6 //添加ClassFileTransformer 7 void addTransformer(ClassFileTransformer transformer); 8 9 //移除ClassFileTransformer 10 boolean removeTransformer(ClassFileTransformer transformer); 11 12 //是否能够被从新定义 13 boolean isRetransformClassesSupported(); 14 15 //从新定义Class文件 16 void redefineClasses(ClassDefinition... definitions) 17 throws ClassNotFoundException, UnmodifiableClassException; 18 19 //是否能够修改Class文件 20 boolean isModifiableClass(Class<?> theClass); 21 22 //获取全部加载的Class 23 @SuppressWarnings("rawtypes") 24 Class[] getAllLoadedClasses(); 25 26 //获取指定类加载器已经初始化的类 27 @SuppressWarnings("rawtypes") 28 Class[] getInitiatedClasses(ClassLoader loader); 29 30 //获取某个对象的大小 31 long getObjectSize(Object objectToSize); 32 33 //添加指定jar包到启动类加载器检索路径 34 void appendToBootstrapClassLoaderSearch(JarFile jarfile); 35 36 //添加指定jar包到系统类加载检索路径 37 void appendToSystemClassLoaderSearch(JarFile jarfile); 38 39 //本地方法是否支持前缀 40 boolean isNativeMethodPrefixSupported(); 41 42 //设置本地方法前缀,通常用于按前缀作匹配操做 43 void setNativeMethodPrefix(ClassFileTransformer transformer, String prefix); 44 }
主要是定义了操做java类的class文件方法,这里又涉及到了ClassFileTransformer接口,这个接口的做用是改变Class文件的字节码,返回新的字节码数组,源码以下:
1 public interface ClassFileTransformer 2 { 3 4 byte[] transform(ClassLoader loader, String className, Class<?> classBeingRedefined, 5 ProtectionDomain protectionDomain, byte[] classfileBuffer) 6 throws IllegalClassFormatException; 7 }
ClassFileTransformer接口只有一个方法,就是改变指定类的Class文件,该接口没有默认实现,很显然若是须要改变Class文件的内容,须要改为什么样须要使用者本身来实现。
Instrumentation能够在带有main方法的应用程序以前运行,经过-javaagent参数来指定一个特色的jar文件(包含Instrumentation代理)来启动Instrumentation的代理程序,因此首先须要编写一个Instrumentation的代理程序,案例以下:
新建代理项目
1 public class MyAgent 2 { 3 /** 4 * 参数args是启动参数 5 * 参数inst是JVM启动时传入的Instrumentation实现 6 * */ 7 public static void premain(String args,Instrumentation inst) 8 { 9 System.out.println("premain方法会在main方法以前执行......"); 10 inst.addTransformer(new MyTransformClass()); 11 } 12 } 13 14 ------------------------------------------------------------------------ 15 public class MyTransformClass implements ClassFileTransformer 16 { 17 18 @Override 19 public byte[] transform(ClassLoader loader, String className, Class<?> classBeingRedefined, 20 ProtectionDomain protectionDomain, byte[] classfileBuffer) 21 throws IllegalClassFormatException 22 { 23 // 定义从新编译以后的字符流数组 24 byte[] newClassFileBuffer = new byte[classfileBuffer.length]; 25 String transClassName = "com.mrhu.opin.controller.TestController";//重定义指定类,也能够重定义指定package下的类,使用者自由发挥 26 if (className.equals(transClassName)) 27 { 28 System.out.println("监控到目标类,从新编辑Class文件字符流..."); 29 // TODO 对目标类的Class文件字节流进行从新编辑 30 // 对byte[]从新编译可使用第三方工具如javassist,感兴趣的可自行研究 31 // 本文图方便,直接返回旧的字节数组 32 newClassFileBuffer = classfileBuffer; 33 } 34 return newClassFileBuffer; 35 } 36 37 }
编译打包项目为 instrumentdemo.jar,而后其余在须要被监控的项目启动参数中添加以下参数:
-javaagent:instrumentdemo.jar
而后在被监控应用程序执行main方法以前就会先执行premain方法,走instrumentation代理程序,那么在应用程序加载类的时候就会进入到自定义的ClassFileTransformer中
Instrumentation还能够添加多个代理,按照代理指定的顺序依次调用
(详细案例能够自行百度了解,本文只作理论描述)
因此Instrumentation接口至关于一个代理,当执行premain方法时,经过Instrumentation提供的API能够动态的添加管理JVM加载的Class文件,Instrumentation管理着ClassFileTransformer。
ClassFileTransformer接口能够动态的改变Class文件的字节码,在加载字节码的时候能够将字节码进行动态修改,具体实现须要自定义实现类来实现ClassFileTransformer接口
那么premain方法中的Instrumentation对象是如何传入的呢?答案是JVM传入的。
提及Instrumentation的原理,就不得不先提起JVMTI,全程是JVM Tool Interface顾名思义是JVM提供的工具接口,也就是JVM提供给用户的扩展接口集合。
JVMTI是基于事件驱动的,JVM每执行到必定的逻辑就会调用一些事件的回调接口,这些接口能够供开发者扩展自行的逻辑。
好比我想监听JVM加载某个类的事件,那么咱们就能够实现一个回调函数赋给jvmtiEnv的回调方法集合里的ClassFileLoadHook(Class类加载事件),那么当JVM进行类加载时就会触发回调函数,咱们就能够在JVM加载类的时候作一些扩展操做,
好比上面提到的更改这个类的Class文件信息来加强这个类的方法。
JVMTI运行时,一个JVMTIAgent对应一个jvmtiEnv或者是多个,JVMTIAgent是一个动态库,利用JVMTI暴露出来的接口来进行扩展。
主要有三个函数:
Agent_OnLoad方法:若是agent是在启动时加载的,那么在JVM启动过程当中会执行这个agent里的Agent_OnLoad函数(经过-agentlib加载vm参数中)
Agent_OnAttach方法:若是agent不是在启动时加载的,而是attach到目标程序上,而后给对应的目标程序发送load命令来加载,则在加载过程当中会调用Agent_OnAttach方法
Agent_OnUnload方法:在agent卸载时调用
咱们经常使用的Eclipse等调试代码实际就是使用到了这个JVMTIAgent
回到主题,Instrument 就是一种 JVMTIAgent,它实现了Agent_OnLoad和Agent_OnAttach两个方法,也就是在使用时,Instrument既能够在启动时加载,也能够再运行时加动态加载
启动时加载就是在启动时添加JVM参数:-javaagent:XXXAgent.jar的方式
运行时加载是经过JVM的attach机制来实现,经过发送load命令来加载
Instrument agent启动时加载会实现Agent_OnLoad方法,具体实现逻辑以下:
1.建立并初始化JPLISAgent
2.监听VMInit事件,在vm初始化完成以后执行下面逻辑
a.建立Instrumentation接口的实例,也就是InstrumentationImpl对象
b.监听ClassFileLoadHook事件(类加载事件)
c.调用InstrumentationImpl类的loadClassAndCallPremain方法,这个方法会调用javaagent的jar包中里的MANIFEST.MF里指定的Premain-Class类的premain方法
3.解析MANIFEST.MF里的参数,并根据这些参数来设置JPLISAgent里的内容
Instrument agent运行时加载会使用Agent_OnAttach方法,会经过JVM的attach机制来请求目标JVM加载对应的agent,过程以下
1.建立并初始化JPLISAgent
2.解析javaagent里的MANIFEST.MF里的参数
3.建立InstrumentationImpl对象
4.监听ClassFileLoadHook事件
5.调用InstrumentationImpl类的loadClassAndCallPremain方法,这个方法会调用javaagent的jar包中里的MANIFEST.MF里指定的Premain-Class类的premain方法
启动时加载和运行时加载都是监听同一个jvmti事件那就是ClassFileLoadHook,这个是类加载的事件,在读取类文件字节码以后回调用的,这样就能够对字节码进行修改操做。
在JVM加载类文件时,执行回调,加载Instrument agent,建立Instrumentation接口的实例而且执行premain方法,premain方法中注册自定义的ClassFileTransformer来对字节码文件进行操做,这个就是在加载时进行字节码加强的过程。
那么若是java类已经加载完成了,在运行的过程当中须要进行字节码加强的时候还可使用Instrumentation接口的redifineClasses方法,有兴趣的能够自行研究源码,这里只描述大体过程。
经过执行该方法,在JVM中至关因而建立了一个VM_RedifineClasses的VM_Operation,此时会stop_the_world,具体的执行过程以下:
挨个遍历要批量重定义的 jvmtiClassDefinition 而后读取新的字节码,若是有关注 ClassFileLoadHook 事件的,还会走对应的 transform 来对新的字节码再作修改 字节码解析好,建立一个 klassOop 对象 对比新老类,并要求以下: 父类是同一个 实现的接口数也要相同,而且是相同的接口 类访问符必须一致 字段数和字段名要一致 新增的方法必须是 private static/final 的 能够删除修改方法 对新类作字节码校验 合并新老类的常量池 若是老类上有断点,那都清除掉 对老类作 JIT 去优化 对新老方法匹配的方法的 jmethodId 作更新,将老的 jmethodId 更新到新的 method 上 新类的常量池的 holer 指向老的类 将新类和老类的一些属性作交换,好比常量池,methods,内部类 初始化新的 vtable 和 itable 交换 annotation 的 method、field、paramenter 遍历全部当前类的子类,修改他们的 vtable 及 itable
上面是基本的过程,总的来讲就是只更新了类里的内容,至关于只更新了指针指向的内容,并无更新指针,避免了遍历大量已有类对象对它们进行更新所带来的开销。
另外还能够经过retransform来进行回滚操做,能够回滚到字节码以前的版本。
------------------------------------------------------------
总结:
1. Instrumentation至关于一个JVM级别的AOP
2.Instrumentation在JVM启动的时候监听事件,如类加载事件,JVM触发来指定的事件经过回调通知,并建立一个 Instrumentation接口的实例,而后找到MANIFEST.MF中配置的实现了premain方法的Class
而后将Instrumentation实例传入premain方法中
3.premain方法会在main方法以前执行,能够添加ClassFileTransfer来实现对Class文件字节码的动态修改(并不会修改Class文件中的字节码,而是修改已经被JVM加载的字节码)
4.修改字节码的技术可使用开源的 ASM、javassist、byteBuddy等
执行premain方法是经过在JVM启动的时候实现的动态代理,那么若是想要在JVM的运行过程当中实现这个功能该如何实现呢?这就须要使用JVM的attach机制
JVM提供了一种attach机制,简单点说就是能够经过一个JVM来操做、查询另外一个JVM中的数据,好比最经常使用的jmap、jstack等命令就是经过attach机制实现的。
当须要dump一个JVM进程中的堆信息时,此时就能够经过开启另外一个JVM进程,如何经过这个JVM进程来和目标JVM进程进行通讯,执行想要执行的命令或者查询想要的数据
Attach 实现的根本原理就是使用了 Linux 下是文件 Socket 通讯(详情能够自行百度或 Google)。有人也许会问,为何要采用文件 socket 而不采用网络 socket?我我的认为也许一方面是为了效率(避免了网络协议的解析、数据包的封装和解封装等),另外一方面是为了减小对系统资源的占用(如网络端口占用)。采用文件 socket 通讯,就比如两个进程经过事先约定好的协议,对同一个文件进行读写操做,以达到信息的交互和共享。简单理解成以下图所示的模型