序列化和反序列化的底层实现原理是什么?

前言

序列化和反序列化做为Java里一个较为基础的知识点,你们内心也有那么几句要说的,但我相信不少小伙伴掌握的也就是那么几句而已,若是再深究问一下Java如何实现序列化和反序列化的,就可能不知所措了!遥记当年也被问了这一个问题,自信满满的说了一大堆,什么是序列化、什么是反序列化、什么场景的时候才会用到等,而后面试官说:那你能说一下序列化和反序列化底层是如何实现的吗?一脸懵逼,而后回家等通知!结果天然是凉了~java

1、基本概念

一、什么是序列化和反序列化程序员

(1)Java序列化是指把Java对象转换为字节序列的过程,而Java反序列化是指把字节序列恢复为Java对象的过程;面试

(2)序列化:对象序列化的最主要的用处就是在传递和保存对象的时候,保证对象的完整性和可传递性。序列化是把对象转换成有序字节流,以便在网络上传输或者保存在本地文件中。序列化后的字节流保存了Java对象的状态以及相关的描述信息。序列化机制的核心做用就是对象状态的保存与重建。算法

(3)反序列化:客户端从文件中或网络上得到序列化后的对象字节流后,根据字节流中所保存的对象状态及描述信息,经过反序列化重建对象。数据库

(4)本质上讲,序列化就是把实体对象状态按照必定的格式写入到有序字节流,反序列化就是从有序字节流重建对象,恢复对象状态。安全

二、为何须要序列化与反序列化bash

咱们知道,当两个进程进行远程通讯时,能够相互发送各类类型的数据,包括文本、图片、音频、视频等, 而这些数据都会以二进制序列的形式在网络上传送。网络

那么当两个Java进程进行通讯时,可否实现进程间的对象传送呢?答案是能够的!如何作到呢?这就须要Java序列化与反序列化了!架构

换句话说,一方面,发送方须要把这个Java对象转换为字节序列,而后在网络上传送;另外一方面,接收方须要从字节序列中恢复出Java对象。框架

当咱们明晰了为何须要Java序列化和反序列化后,咱们很天然地会想Java序列化的好处。其好处一是实现了数据的持久化,经过序列化能够把数据永久地保存到硬盘上(一般存放在文件里),二是,利用序列化实现远程通讯,即在网络上传送对象的字节序列。

总的来讲能够归结为如下几点:

(1)永久性保存对象,保存对象的字节序列到本地文件或者数据库中;

(2)经过序列化以字节流的形式使对象在网络中进行传递和接收;

(3)经过序列化在进程间传递对象;

三、序列化算法通常会按步骤作以下事情:

(1)将对象实例相关的类元数据输出。

(2)递归地输出类的超类描述直到再也不有超类。

(3)类元数据完了之后,开始从最顶层的超类开始输出对象实例的实际数据值。

(4)从上至下递归输出实例的数据

2、Java如何实现序列化和反序列化

一、JDK类库中序列化和反序列化API

(1)java.io.ObjectOutputStream:表示对象输出流;

它的writeObject(Object obj)方法能够对参数指定的obj对象进行序列化,把获得的字节序列写到一个目标输出流中;

(2)java.io.ObjectInputStream:表示对象输入流;

它的readObject()方法源输入流中读取字节序列,再把它们反序列化成为一个对象,并将其返回;

二、实现序列化的要求

只有实现了Serializable或Externalizable接口的类的对象才能被序列化,不然抛出异常!

三、实现Java对象序列化与反序列化的方法

假定一个User类,它的对象须要序列化,能够有以下三种方法:

(1)若User类仅仅实现了Serializable接口,则能够按照如下方式进行序列化和反序列化

ObjectOutputStream采用默认的序列化方式,对User对象的非transient的实例变量进行序列化。

ObjcetInputStream采用默认的反序列化方式,对对User对象的非transient的实例变量进行反序列化。

(2)若User类仅仅实现了Serializable接口,而且还定义了readObject(ObjectInputStream in)和writeObject(ObjectOutputSteam out),则采用如下方式进行序列化与反序列化。

ObjectOutputStream调用User对象的writeObject(ObjectOutputStream out)的方法进行序列化。

ObjectInputStream会调用User对象的readObject(ObjectInputStream in)的方法进行反序列化。

(3)若User类实现了Externalnalizable接口,且User类必须实现readExternal(ObjectInput in)和writeExternal(ObjectOutput out)方法,则按照如下方式进行序列化与反序列化。

ObjectOutputStream调用User对象的writeExternal(ObjectOutput out))的方法进行序列化。

ObjectInputStream会调用User对象的readExternal(ObjectInput in)的方法进行反序列化。

四、JDK类库中序列化的步骤

步骤一:建立一个对象输出流,它能够包装一个其它类型的目标输出流,如文件输出流:

ObjectOutputStream oos = new ObjectOutputStream(new FileOutputStream("D:\object.out"));
复制代码

步骤二:经过对象输出流的writeObject()方法写对象:

oos.writeObject(new User("xuliugen", "123456", "male"));
复制代码

五、JDK类库中反序列化的步骤

步骤一:建立一个对象输入流,它能够包装一个其它类型输入流,如文件输入流:

ObjectInputStream ois= new ObjectInputStream(new FileInputStream("object.out"));
复制代码

步骤二:经过对象输出流的readObject()方法读取对象:

User user = (User) ois.readObject();
复制代码

说明:为了正确读取数据,完成反序列化,必须保证向对象输出流写对象的顺序与从对象输入流中读对象的顺序一致。

六、序列化和反序列化的示例

为了更好地理解Java序列化与反序列化,举一个简单的示例以下:

public class SerialDemo {

    public static void main(String[] args) throws IOException, ClassNotFoundException {
        //序列化
        FileOutputStream fos = new FileOutputStream("object.out");
        ObjectOutputStream oos = new ObjectOutputStream(fos);
        User user1 = new User("xuliugen", "123456", "male");
        oos.writeObject(user1);
        oos.flush();
        oos.close();
        //反序列化
        FileInputStream fis = new FileInputStream("object.out");
        ObjectInputStream ois = new ObjectInputStream(fis);
        User user2 = (User) ois.readObject();
        System.out.println(user2.getUserName()+ " " + 
            user2.getPassword() + " " + user2.getSex());
        //反序列化的输出结果为:xuliugen 123456 male
    }
}

public class User implements Serializable {
    private String userName;
    private String password;
    private String sex;
    //全参构造方法、get和set方法省略
}
复制代码

object.out文件以下(使用UltraEdit打开):

注:上图中0000000h-000000c0h表示行号;0-f表示列;行后面的文字表示对这行16进制的解释;对上述字节码所表述的内容感兴趣的能够对照相关的资料,查阅一下每个字符表明的含义,这里不在探讨!

相似于咱们Java代码编译以后的.class文件,每个字符都表明必定的含义。序列化和反序列化的过程就是生成和解析上述字符的过程!

序列化图示:

反序列化图示:

3、相关注意事项

一、序列化时,只对对象的状态进行保存,而无论对象的方法;

二、当一个父类实现序列化,子类自动实现序列化,不须要显式实现Serializable接口;

三、当一个对象的实例变量引用其余对象,序列化该对象时也把引用对象进行序列化;

四、并不是全部的对象均可以序列化,至于为何不能够,有不少缘由了,好比:

  • 安全方面的缘由,好比一个对象拥有private,public等field,对于一个要传输的对象,好比写到文件,或者进行RMI传输等等,在序列化进行传输的过程当中,这个对象的private等域是不受保护的;

  • 资源分配方面的缘由,好比socket,thread类,若是能够序列化,进行传输或者保存,也没法对他们进行从新的资源分配,并且,也是没有必要这样实现;

五、声明为static和transient类型的成员数据不能被序列化。由于static表明类的状态,transient表明对象的临时数据。

六、序列化运行时使用一个称为 serialVersionUID 的版本号与每一个可序列化类相关联,该序列号在反序列化过程当中用于验证序列化对象的发送者和接收者是否为该对象加载了与序列化兼容的类。为它赋予明确的值。显式地定义serialVersionUID有两种用途:

  • 在某些场合,但愿类的不一样版本对序列化兼容,所以须要确保类的不一样版本具备相同的serialVersionUID;

  • 在某些场合,不但愿类的不一样版本对序列化兼容,所以须要确保类的不一样版本具备不一样的serialVersionUID。

七、Java有不少基础类已经实现了serializable接口,好比String,Vector等。可是也有一些没有实现serializable接口的;

八、若是一个对象的成员变量是一个对象,那么这个对象的数据成员也会被保存!这是能用序列化解决深拷贝的重要缘由;

4、总结

看到这里,可能已经让咱们很知足了,毕竟已经知道了咱们平时使用的序列化和反序列化是如何进行操做的,Java给咱们提供了哪些接口可供使用,也比咱们最初知道的简单的什么是序列化、反序列化以及做用多了不少!后续内容咱们也会不断再讨论和更新!

读者福利:Java架构师进阶学习指南

开源框架解析专题
高性能架构专题
微服务架构专题

若是你是Java程序员,对于上诉所说的技术提高很感兴趣,能够加QQ群:867923845点击当即加入免费获取笔者整理的适合1~5年的Java工程师学习参考的资源。还有大量面试题以及解析。欢迎各位工程师加入,合理利用本身每一分每一秒的时间来学习提高本身,不要再用"没有时间“来掩饰本身思想上的懒惰!趁年轻,使劲拼,给将来的本身一个交代!

还有更多你不知道的面试题资料哦(含答案)

相关文章
相关标签/搜索