深入分析序列化和反序列化原理，终于知道serialVersionUID到底有什么用了_private static final long serialversionuid 和实现序列化有-程序员宅基地

深入序列化和反序列化原理

一个问题引发的思考
什么是序列化和反序列化
为什么需要序列化
序列化的方式
序列化技术的选型

一个问题引发的思考

下面是一个简单的socket通信demo。
通信数据类：

package com.zwx.serialize.demo;

public class SocketUser {
    
    public SocketUser(String id, String name) {
    
        this.id = id;
        this.name = name;
    }

    private String id;
    private String name;

    public String getId() {
    
        return id;
    }

    public void setId(String id) {
    
        this.id = id;
    }

    public String getName() {
    
        return name;
    }

    public void setName(String name) {
    
        this.name = name;
    }
}

socket服务端：

package com.zwx.serialize.demo;

import com.alibaba.fastjson.JSONObject;
import java.io.IOException;
import java.io.ObjectInputStream;
import java.net.ServerSocket;
import java.net.Socket;

public class SocketServer {
    
    public static void main(String[] args) {
    
        ServerSocket serverSocket = null;
        try {
    
            serverSocket = new ServerSocket(8888);
            Socket socket = serverSocket.accept();
            ObjectInputStream input = new ObjectInputStream(socket.getInputStream());
            SocketUser user = (SocketUser) input.readObject();
            System.out.println(JSONObject.toJSONString(user));

        }catch (Exception e){
    
            e.printStackTrace();
        }finally {
    
            if (null != serverSocket){
    
                try {
    
                    serverSocket.close();
                } catch (IOException e) {
    
                    e.printStackTrace();
                }

            }
        }
    }
}

socket客户端：

package com.zwx.serialize.demo;

import java.io.IOException;
import java.io.ObjectOutputStream;
import java.net.Socket;

public class SocketClient {
    
    public static void main(String[] args) {
    
        Socket socket = null;
        ObjectOutputStream out = null;
        try {
    
            socket = new Socket("localhost",8888);
            SocketUser user = new SocketUser("1","张三");
            out = new ObjectOutputStream(socket.getOutputStream());
            out.writeObject(user);

        }catch (Exception e){
    
            e.printStackTrace();
        }finally {
    
            if (null != out){
    
                try {
    
                    out.close();
                } catch (IOException e) {
    
                    e.printStackTrace();
                }
            }
            if (null != socket){
    
                try {
    
                    socket.close();
                } catch (IOException e) {
    
                    e.printStackTrace();
                }
            }
        }
    }
}

接下来我们先启动socket服务端，然后再启动socket客户端，这时候客户端就会连接上服务端进行通讯数据传输。
运行时却发现，报错了，提示我们没有序列化：
在这里插入图片描述
这时候我们把类SocketUser改一下,实现序列化接口：

public class SocketUser implements Serializable{

再次运行，发现这时候服务端可以正常输出我们传入的SocketUser对象了：
在这里插入图片描述
所以我们可以知道，当我们在远程通信的时候，必须要序列化数据才能正常传输，那么到底什么是序列化，什么又是反序列化呢？

什么是序列化和反序列化

序列化：是把对象的状态信息转化为可存储或传输的形式过程，也就是把对象转化为字节序列的过程称为对象的序列化。
反序列化：是序列化的逆向过程，把字节数组反序列化为对象，把字节序列恢复为对象的过程称为对象的反序列化。

为什么需要序列化

序列化的本质是为了进行网络数据传输，而数据又只能够以二进制的形式在网络中进行传输，所以我们就需要把对象转为二进制的形式，也就是需要序列化这么一个过程，而因为二进制形式对我们使用者来说是不方便的，所以就需要有一个反序列化的过程，将数据重新还原。

序列化的方式

序列化的方式有很多种，比如Java自带的序列化方式，json序列化，xml序列化等。

Java序列化

文中开始的例子就是Java自带的序列化，其中SocketClient是序列化过程，SocketServer就是反序列化过程。

serialVersionUID的作用

当我们在实现序列化接口Serializable时候，可以手动生成一个serialVersionUID，有两种表现形式：

private static final long serialVersionUID = -2426545572670767992L;
private static final long serialVersionUID = 1L;

那么这两种形式有什么区别？serialVersionUID 又到底有什么用呢？为了说明这两个问题，我们还是先来看一个例子：
SocketUser沿用上面的类，但是不要添加serialVersionUID属性

package com.zwx.serialize;

import com.alibaba.fastjson.JSONObject;
import com.zwx.serialize.demo.SocketUser;
import java.io.*;

public class TestJavaSerialize {
    
    public static void main(String[] args) {
    
    	//代码片段A：序列化
        SocketUser socketUser = new SocketUser("1","张三");
        serialize(socketUser);
         //代码片段B：反序列化
//        SocketUser socketUser2 = deSerialize();
//        System.out.println(JSONObject.toJSONString(socketUser2));

    }

    static void serialize(SocketUser user){
    
        try {
    
            ObjectOutputStream out = new ObjectOutputStream(new FileOutputStream(new File("G:\\user")));
            out.writeObject(user);
        } catch (IOException e) {
    
            e.printStackTrace();
        }
    }

    static SocketUser deSerialize(){
    
        try {
    
            ObjectInputStream in = new ObjectInputStream(new FileInputStream(new File("G:\\user")));
            return (SocketUser) in.readObject();
        }catch (Exception e){
    
            e.printStackTrace();
        }
        return null;
    }
}

上面的例子中，我们把创建好的SocketUser对象初始化到了本地文件中，然后先不要反序列化，我们在SocketUser类中自动生成serialVersionUID = -2426545572670767992L;

然后把上面的代码片段A注释掉，把代码片段B打开注释，运行，发现反序列化成功，这个没有问题。好，那我们把serialVersionUID = -2426545572670767992L;换成serialVersionUID =1L，再去运行，这时候发现报错了: 在这里插入图片描述
这是因为如果我们没有生成serialVersionUID的话，那么当序列化的时候，会自动在序列化对象中自动生成serialVersionUID，而如果我们没有修改过类中的方法和属性，这个值是不会变的，所以我们序列化之后再去生成serialVersionUID，因为算法一直，所以两边的UID依然是相同的，但是我们改成了1L就不行了，会导致UID不相等，无法反序列化，当然，如果我们手动修改serialVersionUID值，也会导致匹配不上，或者说我们修改了类的属性和方法之后再去重新生成，也会导致匹配不上而无法反序列化。

serialVersionUID的两种表现形式

serialVersionUID默认有两种表现方式：

一种是根据类名、接口名、成员方法及属性等来生成一个 64 位的哈希字段。
比如：private static final long serialVersionUID = -2426545572670767992L;。
另一种就是1L。
比如private static final long serialVersionUID = 1L;

如果我们没有手动生成serialVersionUID，则系统会默认采用第一种方式生成，如果我们此时又手动采用了第二种方式生成serialVersionUID，那么反序列化的时候就会发现两边的UID匹配不上，导致反序列化失败。

Transient关键字

Transient 关键字的作用是控制变量的序列化，在变量声明前加上该关键字，可以阻止该变量被序列化到文件中，在被反序列化后，transient 变量的值被设为初始值，如 int 型的是 0，对象型的是null。
如我们把上面的name属性加上transient 关键字之后再去序列化,：

private transient String name;

然后反序列化可以看到name=null：
在这里插入图片描述
不过，我们有办法可以绕开transient 关键字，从而使得transient 关键字失效。这就是下面的两个方法：writeObject和readObject的作用了。

writeObject和readObject

我们把上面的SocketUser类进行一下改写：

package com.zwx.serialize.demo;

import java.io.IOException;
import java.io.Serializable;

public class SocketUser implements Serializable{
    

    public SocketUser(String id, String name) {
    
        this.id = id;
        this.name = name;
    }

    private String id;
    private transient String name;

    private void writeObject(java.io.ObjectOutputStream s) throws IOException {
    
        s.defaultWriteObject();
        s.writeObject(name);
    }

    private void readObject(java.io.ObjectInputStream s) throws IOException, ClassNotFoundException {
    
        s.defaultReadObject();
        name=(String)s.readObject();
    }

    public String getId() {
    
        return id;
    }

    public void setId(String id) {
    
        this.id = id;
    }

    public String getName() {
    
        return name;
    }

    public void setName(String name) {
    
        this.name = name;
    }
}

然后再去序列化和反序列化，发现name属性已经可以被反序列化出来了：
在这里插入图片描述

Java序列化特点

1、Java序列化只是针对对象的状态进行保存，至于对象中的方法，序列化不关心。
2、当一个父类实现了序列化，那么子类会自动实现序列化，不需要显示实现序列化接口。
3、当一个对象的实例变量引用了其他对象，序列化这个对象的时候会自动把引用的对象也进行序列化（实现深度克隆）。
4、当某个字段被申明为transient后，默认的序列化机制会忽略这个字段。
5、被申明为transient 的字段，如果需要序列化，可以添加两个私有方法：writeObject 和 readObject 。

Java序列化的缺点

如果会用Java序列化会有两个缺点：

不能跨语言。序列化本身就是为了数据传输，那么不能跨语言，就说明通信的对方也必须是Java语言才行，这一点就造成了很大的局限性。
序列化之后数据比较大。远程通信数据包越小效率就越高，所以序列化之后的二进制流越小，性能越高。
我们针对Java序列化之后的数据包大小来个测试：
定义一个序列化接口(方便后面其他序列化方式共用)：

package com.zwx.serialize;

public interface ISerializer {
    

    <T> byte[] serialize(T obj);

    <T> T deserialize(byte[] data,Class<T> clazz);
}

新建一个Java序列化类实现ISerializer接口：

package com.zwx.serialize;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;
import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;

public class JavaSerialize implements ISerializer{
    
    @Override
    public <T> byte[] serialize(T obj) {
    
        ByteArrayOutputStream byteArrayOutputStream = new ByteArrayOutputStream();
        try {
    
            ObjectOutputStream objectOutputStream = new ObjectOutputStream(byteArrayOutputStream);
            objectOutputStream.writeObject(obj);
            return byteArrayOutputStream.toByteArray();
        }catch (Exception e){
    
            e.printStackTrace();
        }
        return null;
    }

    @Override
    public <T> T deserialize(byte[] data, Class<T> clazz) {
    
        ByteArrayInputStream byteArrayInputStream = new ByteArrayInputStream(data);
        try {
    
            ObjectInputStream objectInputStream = new ObjectInputStream(byteArrayInputStream);
            return (T)objectInputStream.readObject();
        }catch (Exception e){
    
            e.printStackTrace();
        }
        return null;
    }
}

最后新建一个测试类来测试一下Java序列化之后的字节大小：

package com.zwx.serialize;

import com.zwx.serialize.demo.SocketUser;

public class TestSerialize {
    
    public static void main(String[] args) {
    
        SocketUser socketUser = new SocketUser("1","张三丰");

        //Java序列化
        JavaSerialize javaSerialize = new JavaSerialize();
        byte[] byteArr = javaSerialize.serialize(socketUser);
        System.out.println(byteArr.length);//108
    }
}

输出之后大小为108，先记住这个数字，我们再来看看其他序列化方式在序列化之后的字节大小。

XML序列化

引入XML序列化依赖：

 <dependency>
    <groupId>com.thoughtworks.xstream</groupId>
     <artifactId>xstream</artifactId>
     <version>1.4.10</version>
 </dependency>

新建一个XML序列化类实现ISerializer接口：

package com.zwx.serialize;

import com.thoughtworks.xstream.XStream;
import com.thoughtworks.xstream.io.xml.DomDriver;

public class XMLSerializer implements ISerializer {
    
    XStream xStream=new XStream(new DomDriver());
    @Override
    public <T> byte[] serialize(T obj) {
    
        return xStream.toXML(obj).getBytes();
    }

    @Override
    public <T> T deserialize(byte[] data, Class<T> clazz) {
    
        return (T)xStream.fromXML(new String(data));
    }
}

最后在之前的测试类中测试一下XML序列化的大小为110：

//XML序列化
XMLSerializer xmlSerializer = new XMLSerializer();
System.out.println(xmlSerializer.serialize(socketUser).length);//110

JSON序列化

JSON（JavaScript Object Notation）是一种轻量级的数据交换格式，相对于XML来说，JSON 的字节流更小，而且可读性也非常好。现在JSON数据格式在企业运用是最普遍的 JSON序列化常用的开源工具有很多，如：Jackson，FastJson，GSON。

下面以FastJson来举例：

新建一个FastJson序列化类实现ISerializer接口：

package com.zwx.serialize;

import com.alibaba.fastjson.JSON;

public class FastJsonSerialize implements ISerializer {
    
    @Override
    public <T> byte[] serialize(T obj) {
    
        return JSON.toJSONString(obj).getBytes();
    }

    @Override
    public <T> T deserialize(byte[] data, Class<T> clazz) {
    
        return (T)JSON.parseObject(new String(data),clazz);
    }
}

最后在测试类中添加如下代码，测试结果大小为：29。

//FastJson序列化
FastJsonSerialize fastJsonSerialize = new FastJsonSerialize();
 System.out.println(fastJsonSerialize.serialize(socketUser).length);//29

常用三种序列化方式对比

从上面的例子中我们可以看到，同样一个对象，序列化之后的大小FastJson是最小的，而XML最大。而数据包越大，相对来说通讯的性能就会越低。

针对性能要求不高的场景，可以采用基于XML的SOAP协议。
基于前后端分离，或者独立的对外的 api 服务，选用JSON是比较好的，对于调试、可读性都很不错。

其他序列化

Hessian序列化：
Hessian是一个支持跨语言传输的二进制序列化协议，相对于Java默认的序列化机制来说， Hessian具有更好的性能和易用性，而且支持多种不同的语言。实际上Dubbo采用的就是Hessian 序列化来实现，只不过Dubbo对Hessian进行了重构，性能更高。
Avro序列化：
Avro是一个数据序列化系统，设计用于支持大批量数据交换的应用。它的主要特点有：支持二进制序列化方式，可以便捷，快速地处理大量数据；动态语言友好，Avro提供的机制使动态语言可以方便地处理Avro数据。
kyro 序列化：
Kryo是一种非常成熟的序列化实现，已经在Hive、Storm中使用得比较广泛，不过它不能跨语言. 目前 dubbo 已经在 2.6 版本支持 kyro 的序列化机制。它的性能要优于之前的 hessian。
Protobuf 序列化：
Protobuf是Google的一种数据交换格式，它独立于语言、独立于平台。Google提供了多种语言来实现，比如Java、C、Go、Python，每一种实现都包含了相应语言的编译器和库文件， Protobuf是一个纯粹的表示层协议，可以和各种传输层协议一起使用。 Protobuf使用比较广泛，主要是空间开销小和性能比较好，非常适合用于公司内部对性能要求高的 RPC调用。另外由于解析性能比较高，序列化以后数据量相对较少，所以也可以应用在对象的持久化场景中。
Protobuf使用会相对麻烦些，因为他有自己的语法，有自己的编译器，如果需要用到的话必须要去投入成本在这个技术的学习中。
protobuf还有个缺点就是要传输的每一个类的结构都要生成对应的proto文件，如果某个类发生修改，还得重新生成该类对应的proto文件。

序列化技术的选型

如何选择一种合适的序列化方式，可以根据以下方面进行综合考虑：

1、序列化空间开销，也就是序列化产生的结果大小，这个影响到传输的性能。
2、序列化过程中消耗的时长，序列化消耗时间过长影响到业务的响应时间。
3、序列化协议是否支持跨平台，跨语言。因为现在的微服务架构更加灵活，如果存在异构系统通信需求，那么这个跨语言是必须要考虑的。
4、可扩展性/兼容性，在实际业务开发中，系统往往需要随着需求的快速迭代来实现快速更新，这就要求我们采用的序列化协议基于良好的可扩展性/兼容性，比如在现有的序列化数据结构中新增一个业务字段，不会影响到现有的服务等。
5、技术的流行程度，越流行的技术意味着使用的公司多，技术解决方案也相对成熟。
6、要考虑学习成本，学习难度和易用性等方面问题。比如Protobuf虽然说性能非常高，但是相应的也需要一定的学习成本。

最后 请关注我，和孤狼一起学习进步。

本文链接：https://blog.csdn.net/zwx900102/article/details/107675524

原作者删帖不实内容删帖广告或垃圾文章投诉

智能推荐

设备驱动模型中设备的init_name成员_struct device init_name-程序员宅基地

文章浏览阅读796次。现象是：依次加载了总线bus，设备device，驱动driver，在加载驱动时候出现了segmentation fault。环境条件：采用的是国嵌的教材（可能是教材比较古老了吧，导致出现这样问题），内核版本使用的是2.6.32.2。最后查找原因是由于空指针导致了在strncmp产生了段错误。_struct device init_name

快速玩转 Llama2！机器学习 PAI 最佳实践（二）—全参数微调训练_llama 全参数训练-程序员宅基地

文章浏览阅读1.1k次。本实践将采用阿里云机器学习平台PAI-DSW模块针对 Llama-2-7B-Chat 进行全参数微调。PAI-DSW是交互式建模平台，该实践适合需要定制化微调模型，并追求模型调优效果的开发者。_llama 全参数训练

安捷伦Agilent/惠普HP 4349B高值电阻表_安捷伦4349b-程序员宅基地

文章浏览阅读33次。安捷伦Agilent 4349B高值电阻表的用途：适用于测量各种电器设备、元件测试、电感器、线圈、生产线的电阻，4349B增加测试吞吐率，同时对4通道绝电阻进行测量。Agilent 4349B增加测试吞吐率，同时对4通道绝电阻进行测量。测量时间：9.5 mS / 28 mS / 98 mS / 397 mS。90-132/198-264 伏交流电；快速接触检查：2毫秒/点。输入/输出电阻：1 kohm。测试电缆长度：最长 2 m。GPIB和处理器接口。显示分辨率：3/4/5位。HP-IB 和处理器接口。_安捷伦4349b

【Dubbo】Dubbo入门_hessian 2.0 serialization protocol-程序员宅基地

文章浏览阅读342次。一、Dubbo是什么分布式服务框架高性能和透明化的RPC远程服务调用方案 SOA服务治理方案二、如何使用Dubbo本地服务 <bean id=“xxxService” class=“com.xxx.XxxServiceImpl” /> <bean id=“xxxAction” class=“com.xxx.XxxAction”&..._hessian 2.0 serialization protocol

LSTM 自动编码器进行时间序列数据异常检测_时间序列lstm识别充电桩异常-程序员宅基地

文章浏览阅读1.5k次，点赞31次，收藏16次。本文将介绍并代码演示使用LSTM对时间序列数据进行异常值检测。_时间序列lstm识别充电桩异常

编写一个简单Java程序，计算银行年存款的本息_编写一个java程序,计算存款的利息,用户将输入存款金额和年利率,然后程序计算一年-程序员宅基地

文章浏览阅读1w次，点赞5次，收藏21次。编写一个简单Java程序，计算银行年存款的本息要求：程序运行后要求用户输入存款本金、年利率和存款年限，最后程序计算并输出相应年限后存款的金额。相应的计算公式为：存款总额=本金 * (1 + 利率)存款年限。提示：请检测用户输入的合法性。可以使用Math类来进行次方的运算：Math.pow(底数,指数)。代码块如下package interestCaculation;/** *@auth..._编写一个java程序,计算存款的利息,用户将输入存款金额和年利率,然后程序计算一年

随便推点

WINDOWS 端CUDA10.2+CUDNN8环境搭建for YOLOV5 and Pytorch1.7-程序员宅基地

文章浏览阅读1.5k次，点赞4次，收藏11次。Windows 端CUDA10.2+CUDNN8环境搭建for Pytorch1.71.CUDA下载安装1.1 查看自己的显卡1.2 显卡驱动下载及安装1.3 显卡驱动安装检测1.4 CUDN下载1.5 CUDN安装1.6 环境变量设置2 CUDNN安装2.1 CUDNN下载2.2 CUDNN安装2.3 CUDA安装检测最近，我做了一些使用YOLOV5算法的项目，遇到了很多的坑，也感叹YOLOV5的人性化操作，如此真香的算法，忍不住拿出来与大家进行分享，现在就把项目过程中的一些操作逐个记录一遍。很不好意_cudnn8

优化Hadoop Balancer运行速度_failed to move blk_1076014847_2274553 with size=89-程序员宅基地

文章浏览阅读6.7k次。 1. 修改dfs.datanode.max.transfer.threads = 4096 (如果运行hbase的话建议为16384)，指定用于在DataNode间传输block数据的最大线程数，老版本的对应参数为dfs.datanode.max.xcievers2. 修改dfs.datanode.balance.bandwidthPerSec = 52428800，指定DataNod..._failed to move blk_1076014847_2274553 with size=89971516 from 172.16.33.248: