深入理解Java对象的序列化与反序列化的应用
当两个进程在进行远程通信时,彼此可以发送各种类型的数据。无论是何种类型的数据,都会以二进制序列的形式在网络上传送。发送方需要把这个java对象转换为字节序列,才能在网络上传送;接收方则需要把字节序列再恢复为java对象。
把java对象转换为字节序列的过程称为对象的序列化。
把字节序列恢复为java对象的过程称为对象的反序列化。
对象的序列化主要有两种用途:
1) 把对象的字节序列永久地保存到硬盘上,通常存放在一个文件中;
2) 在网络上传送对象的字节序列。
一. jdk类库中的序列化api
java.io.objectoutputstream代表对象输出流,它的writeobject(object obj)方法可对参数指定的obj对象进行序列化,把得到的字节序列写到一个目标输出流中。
java.io.objectinputstream代表对象输入流,它的readobject()方法从一个源输入流中读取字节序列,再把它们反序列化为一个对象,并将其返回。
只有实现了serializable和externalizable接口的类的对象才能被序列化。externalizable接口继承自serializable接口,实现externalizable接口的类完全由自身来控制序列化的行为,而仅实现serializable接口的类可以采用默认的序列化方式 。
对象序列化包括如下步骤:
1) 创建一个对象输出流,它可以包装一个其他类型的目标输出流,如文件输出流;
2) 通过对象输出流的writeobject()方法写对象。
对象反序列化的步骤如下:
1) 创建一个对象输入流,它可以包装一个其他类型的源输入流,如文件输入流;
2) 通过对象输入流的readobject()方法读取对象。
下面让我们来看一个对应的例子,类的内容如下:
import java.io.*;
import java.util.date;
public class objectsaver {
public static void main(string[] args) throws exception {
objectoutputstream out = new objectoutputstream(new fileoutputstream("d:""objectfile.obj"));
//序列化对象
customer customer = new customer("阿蜜果", 24);
out.writeobject("你好!");
out.writeobject(new date());
out.writeobject(customer);
out.writeint(123);
out.close();
//反序列化对象
objectinputstream in = new objectinputstream(new fileinputstream("d:""objectfile.obj"));
system.out.println("obj1=" + (string) in.readobject());
system.out.println("obj2=" + (date) in.readobject());
customer obj3 = (customer) in.readobject();
system.out.println("obj3=" + obj3);
int obj4 = in.readint();
system.out.println("obj4=" + obj4);
in.close();
}
}
class customer implements serializable {
private string name;
private int age;
public customer(string name, int age) {
this.name = name;
this.age = age;
}
public string tostring() {
return "name=" + name + ", age=" + age;
}
}
输出结果如下:
二.实现serializable接口
objectoutputstream只能对serializable接口的类的对象进行序列化。默认情况下,objectoutputstream按照默认方式序列化,这种序列化方式仅仅对对象的非transient的实例变量进行序列化,而不会序列化对象的transient的实例变量,也不会序列化静态变量。
当objectoutputstream按照默认方式反序列化时,具有如下特点:
1) 如果在内存中对象所属的类还没有被加载,那么会先加载并初始化这个类。如果在classpath中不存在相应的类文件,那么会抛出classnotfoundexception;
2) 在反序列化时不会调用类的任何构造方法。
如果用户希望控制类的序列化方式,可以在可序列化类中提供以下形式的writeobject()和readobject()方法。
private void writeobject(java.io.objectoutputstream out) throws ioexception
private void readobject(java.io.objectinputstream in) throws ioexception, classnotfoundexception;
当objectoutputstream对一个customer对象进行序列化时,如果该对象具有writeobject()方法,那么就会执行这一方法,否则就按默认方式序列化。在该对象的writeobjectt()方法中,可以先调用objectoutputstream的defaultwriteobject()方法,使得对象输出流先执行默认的序列化操作。同理可得出反序列化的情况,不过这次是defaultreadobject()方法。
有些对象中包含一些敏感信息,这些信息不宜对外公开。如果按照默认方式对它们序列化,那么它们的序列化数据在网络上传输时,可能会被不法份子窃取。对于这类信息,可以对它们进行加密后再序列化,在反序列化时则需要解密,再恢复为原来的信息。
默认的序列化方式会序列化整个对象图,这需要递归遍历对象图。如果对象图很复杂,递归遍历操作需要消耗很多的空间和时间,它的内部数据结构为双向列表。
在应用时,如果对某些成员变量都改为transient类型,将节省空间和时间,提高序列化的性能。
三. 实现externalizable接口
externalizable接口继承自serializable接口,如果一个类实现了externalizable接口,那么将完全由这个类控制自身的序列化行为。externalizable接口声明了两个方法:
public void writeexternal(objectoutput out) throws ioexception
public void readexternal(objectinput in) throws ioexception , classnotfoundexception
前者负责序列化操作,后者负责反序列化操作。
在对实现了externalizable接口的类的对象进行反序列化时,会先调用类的不带参数的构造方法,这是有别于默认反序列方式的。如果把类的不带参数的构造方法删除,或者把该构造方法的访问权限设置为private、默认或protected级别,会抛出java.io.invalidexception: no valid constructor异常。
四. 可序列化类的不同版本的序列化兼容性
凡是实现serializable接口的类都有一个表示序列化版本标识符的静态变量:
private static final long serialversionuid;
以上serialversionuid的取值是java运行时环境根据类的内部细节自动生成的。如果对类的源代码作了修改,再重新编译,新生成的类文件的serialversionuid的取值有可能也会发生变化。
类的serialversionuid的默认值完全依赖于java编译器的实现,对于同一个类,用不同的java编译器编译,有可能会导致不同的serialversionuid,也有可能相同。为了提高哦啊serialversionuid的独立性和确定性,强烈建议在一个可序列化类中显示的定义serialversionuid,为它赋予明确的值。显式地定义serialversionuid有两种用途:
1) 在某些场合,希望类的不同版本对序列化兼容,因此需要确保类的不同版本具有相同的serialversionuid;
2) 在某些场合,不希望类的不同版本对序列化兼容,因此需要确保类的不同版本具有不同的serialversionuid