自动装箱与拆箱

“哥,听说 Java 的每个基本类型都对应了一个包装类型,比如说 int 的包装类型为 Integer,double 的包装类型为 Double,是这样吗?”从三妹这句话当中,能听得出来,她已经提前预习这块内容了。

“是的,三妹。基本类型和包装类型的区别主要有以下 4 点,我来带你学习一下。”我回答说。我们家的斜对面刚好是一所小学,所以时不时还能听到朗朗的读书声,让人心情非常愉快。

“三妹,你准备好了吗?我们开始吧。”

“第一,包装类型可以为 null,而基本类型不可以。别小看这一点区别,它使得包装类型可以应用于 POJO 中,而基本类型则不行。”

“POJO 是什么呢?”遇到不会的就问,三妹在这一点上还是非常兢兢业业的。

“POJO 的英文全称是 Plain Ordinary Java Object,翻译一下就是,简单无规则的 Java 对象,只有字段以及对应的 setter 和 getter 方法。”

  1. class Writer {
  2. private Integer age;
  3. private String name;
  4. public Integer getAge() {
  5. return age;
  6. }
  7. public void setAge(Integer age) {
  8. this.age = age;
  9. }
  10. public String getName() {
  11. return name;
  12. }
  13. public void setName(String name) {
  14. this.name = name;
  15. }
  16. }

和 POJO 类似的,还有数据传输对象 DTO(Data Transfer Object,泛指用于展示层与服务层之间的数据传输对象)、视图对象 VO(View Object,把某个页面的数据封装起来)、持久化对象 PO(Persistant Object,可以看成是与数据库中的表映射的 Java 对象)。

“那为什么 POJO 的字段必须要用包装类型呢?”三妹问。

“《阿里巴巴 Java 开发手册》上有详细的说明,你看。”我打开 PDF,并翻到了对应的内容,指着屏幕念道。

数据库的查询结果可能是 null,如果使用基本类型的话,因为要自动拆箱,就会抛出 NullPointerException 的异常。

“什么是自动拆箱呢?”

“自动拆箱指的是,将包装类型转为基本类型,比如说把 Integer 对象转换成 int 值;对应的,把基本类型转为包装类型,则称为自动装箱。”

“哦。”

“那接下来,我们来看第二点不同。包装类型可用于泛型,而基本类型不可以,否则就会出现编译错误。”一边说着,我一边在 Intellij IDEA 中噼里啪啦地敲了起来。

“三妹,你瞧,编译器提示错误了。”

  1. List<int> list = new ArrayList<>(); // 提示 Syntax error, insert "Dimensions" to complete ReferenceType
  2. List<Integer> list = new ArrayList<>();

“为什么呢?”三妹及时地问道。

“因为泛型在编译时会进行类型擦除,最后只保留原始类型,而原始类型只能是 Object 类及其子类——基本类型是个例外。”

“那,接下来,我们来说第三点,基本类型比包装类型更高效。”我喝了一口茶继续说道。

“作为局部变量时,基本类型在栈中直接存储的具体数值,而包装类型则存储的是堆中的引用。”我一边说着,一边打开 draw.io 画起了图。

自动拆箱与自动装箱,好玩 - 图1

很显然,相比较于基本类型而言,包装类型需要占用更多的内存空间,不仅要存储对象,还要存储引用。假如没有基本类型的话,对于数值这类经常使用到的数据来说,每次都要通过 new 一个包装类型就显得非常笨重。

“三妹,你想知道程序运行时,数据都存储在什么地方吗?”

“嗯嗯,哥,你说说呗。”

“通常来说,有 4 个地方可以用来存储数据。”

1)寄存器。这是最快的存储区,因为它位于 CPU 内部,用来暂时存放参与运算的数据和运算结果。

2)栈。位于 RAM(Random Access Memory,也叫主存,与 CPU 直接交换数据的内部存储器)中,速度仅次于寄存器。但是,在分配内存的时候,存放在栈中的数据大小与生存周期必须在编译时是确定的,缺乏灵活性。基本数据类型的值和对象的引用通常存储在这块区域。

3)堆。也位于 RAM 区,可以动态分配内存大小,编译器不必知道要从堆里分配多少存储空间,生存周期也不必事先告诉编译器,Java 的垃圾收集器会自动收走不再使用的数据,因此可以得到更大的灵活性。但是,运行时动态分配内存和销毁对象都需要占用时间,所以效率比栈低一些。new 创建的对象都会存储在这块区域。

4)磁盘。如果数据完全存储在程序之外,就可以不受程序的限制,在程序没有运行时也可以存在。像文件、数据库,就是通过持久化的方式,让对象存放在磁盘上。当需要的时候,再反序列化成程序可以识别的对象。

“能明白吗?三妹?”

“这节讲完后,我再好好消化一下。”

“那好,我们来说第四点,两个包装类型的值可以相同,但却不相等。”

  1. Integer chenmo = new Integer(10);
  2. Integer wanger = new Integer(10);
  3. System.out.println(chenmo == wanger); // false
  4. System.out.println(chenmo.equals(wanger )); // true

“两个包装类型在使用“==”进行判断的时候,判断的是其指向的地址是否相等,由于是两个对象,所以地址是不同的。”

“而 chenmo.equals(wanger) 的输出结果为 true,是因为 equals() 方法内部比较的是两个 int 值是否相等。”

  1. private final int value;
  2. public int intValue() {
  3. return value;
  4. }
  5. public boolean equals(Object obj) {
  6. if (obj instanceof Integer) {
  7. return value == ((Integer)obj).intValue();
  8. }
  9. return false;
  10. }

虽然 chenmo 和 wanger 的值都是 10,但他们并不相等。换句话说就是:将“==”操作符应用于包装类型比较的时候,其结果很可能会和预期的不符。

“三妹,瞧,((Integer)obj).intValue() 这段代码就是用来自动拆箱的。下面,我们来详细地说一说自动装箱和自动拆箱。”

既然有基本类型和包装类型,肯定有些时候要在它们之间进行转换。把基本类型转换成包装类型的过程叫做装箱(boxing)。反之,把包装类型转换成基本类型的过程叫做拆箱(unboxing)。

在 Java 1.5 之前,开发人员要手动进行装拆箱,比如说:

  1. Integer chenmo = new Integer(10); // 手动装箱
  2. int wanger = chenmo.intValue(); // 手动拆箱

Java 1.5 为了减少开发人员的工作,提供了自动装箱与自动拆箱的功能。这下就方便了。

  1. Integer chenmo = 10; // 自动装箱
  2. int wanger = chenmo; // 自动拆箱

来看一下反编译后的代码。

  1. Integer chenmo = Integer.valueOf(10);
  2. int wanger = chenmo.intValue();

也就是说,自动装箱是通过 Integer.valueOf() 完成的;自动拆箱是通过 Integer.intValue() 完成的。

“嗯,三妹,给你出一道面试题吧。”

  1. // 1)基本类型和包装类型
  2. int a = 100;
  3. Integer b = 100;
  4. System.out.println(a == b);
  5. // 2)两个包装类型
  6. Integer c = 100;
  7. Integer d = 100;
  8. System.out.println(c == d);
  9. // 3)
  10. c = 200;
  11. d = 200;
  12. System.out.println(c == d);

“给你 3 分钟时间,你先思考下,我去抽根华子,等我回来,然后再来分析一下为什么。”

。。。。。。

“嗯,哥,你过来吧,我说一说我的想法。”

第一段代码,基本类型和包装类型进行 == 比较,这时候 b 会自动拆箱,直接和 a 比较值,所以结果为 true。

第二段代码,两个包装类型都被赋值为了 100,这时候会进行自动装箱,按照你之前说的,将“==”操作符应用于包装类型比较的时候,其结果很可能会和预期的不符,我想结果可能为 false。

第三段代码,两个包装类型重新被赋值为了 200,这时候仍然会进行自动装箱,我想结果仍然为 false。

“嗯嗯,三妹,你分析的很有逻辑,但第二段代码的结果为 true,是不是感到很奇怪?”

“为什么会这样呀?”三妹急切地问。

“你说的没错,自动装箱是通过 Integer.valueOf() 完成的,我们来看看这个方法的源码就明白为什么了。”

  1. public static Integer valueOf(int i) {
  2. if (i >= IntegerCache.low && i <= IntegerCache.high)
  3. return IntegerCache.cache[i + (-IntegerCache.low)];
  4. return new Integer(i);
  5. }

是不是看到了一个之前从来没见过的类——IntegerCache?

“难道说是 Integer 的缓存类?”三妹做出了自己的判断。

“是的,来看一下 IntegerCache 的源码吧。”

  1. private static class IntegerCache {
  2. static final int low = -128;
  3. static final int high;
  4. static final Integer cache[];
  5. static {
  6. // high value may be configured by property
  7. int h = 127;
  8. int i = parseInt(integerCacheHighPropValue);
  9. i = Math.max(i, 127);
  10. h = Math.min(i, Integer.MAX_VALUE - (-low) -1);
  11. high = h;
  12. cache = new Integer[(high - low) + 1];
  13. int j = low;
  14. for(int k = 0; k < cache.length; k++)
  15. cache[k] = new Integer(j++);
  16. // range [-128, 127] must be interned (JLS7 5.1.7)
  17. assert IntegerCache.high >= 127;
  18. }
  19. }

大致瞟一下这段代码你就全明白了。-128 到 127 之间的数会从 IntegerCache 中取,然后比较,所以第二段代码(100 在这个范围之内)的结果是 true,而第三段代码(200 不在这个范围之内,所以 new 出来了两个 Integer 对象)的结果是 false。

“三妹,看完上面的分析之后,我希望你记住一点:当需要进行自动装箱时,如果数字在 -128 至 127 之间时,会直接使用缓存中的对象,而不是重新创建一个对象。”

“自动装拆箱是一个很好的功能,大大节省了我们开发人员的精力,但也会引发一些麻烦,比如下面这段代码,性能就很差。”

  1. long t1 = System.currentTimeMillis();
  2. Long sum = 0L;
  3. for (int i = 0; i < Integer.MAX_VALUE;i++) {
  4. sum += i;
  5. }
  6. long t2 = System.currentTimeMillis();
  7. System.out.println(t2-t1);

“知道为什么吗?三妹。”

“难道是因为 sum 被声明成了包装类型 Long 而不是基本类型 long。”三妹若有所思。

“是滴,由于 sum 是个 Long 型,而 i 为 int 类型,sum += i 在执行的时候,会先把 i 强转为 long 型,然后再把 sum 拆箱为 long 型进行相加操作,之后再自动装箱为 Long 型赋值给 sum。”

“三妹,你可以试一下,把 sum 换成 long 型比较一下它们运行的时间。”

。。。。。。

“哇,sum 为 Long 型的时候,足足运行了 5825 毫秒;sum 为 long 型的时候,只需要 679 毫秒。”

“好了,三妹,今天的主题就先讲到这吧。我再去来根华子。”