擦拭法


泛型是一种类似”模板代码“的技术,不同语言的泛型实现方式不一定相同。

Java语言的泛型实现方式是擦拭法(Type Erasure)。

所谓擦拭法是指,虚拟机对泛型其实一无所知,所有的工作都是编译器做的。

例如,我们编写了一个泛型类Pair<T>,这是编译器看到的代码:

  1. public class Pair<T> {
  2. private T first;
  3. private T last;
  4. public Pair(T first, T last) {
  5. this.first = first;
  6. this.last = last;
  7. }
  8. public T getFirst() {
  9. return first;
  10. }
  11. public T getLast() {
  12. return last;
  13. }
  14. }

而虚拟机根本不知道泛型。这是虚拟机执行的代码:

  1. public class Pair {
  2. private Object first;
  3. private Object last;
  4. public Pair(Object first, Object last) {
  5. this.first = first;
  6. this.last = last;
  7. }
  8. public Object getFirst() {
  9. return first;
  10. }
  11. public Object getLast() {
  12. return last;
  13. }
  14. }

因此,Java使用擦拭法实现泛型,导致了:

  • 编译器把类型<T>视为Object
  • 编译器根据<T>实现安全的强制转型。

使用泛型的时候,我们编写的代码也是编译器看到的代码:

  1. Pair<String> p = new Pair<>("Hello", "world");
  2. String first = p.getFirst();
  3. String last = p.getLast();

而虚拟机执行的代码并没有泛型:

  1. Pair p = new Pair("Hello", "world");
  2. String first = (String) p.getFirst();
  3. String last = (String) p.getLast();

所以,Java的泛型是由编译器在编译时实行的,编译器内部永远把所有类型T视为Object处理,但是,在需要转型的时候,编译器会根据T的类型自动为我们实行安全地强制转型。

了解了Java泛型的实现方式——擦拭法,我们就知道了Java泛型的局限:

局限一:<T>不能是基本类型,例如int,因为实际类型是ObjectObject类型无法持有基本类型:

  1. Pair<int> p = new Pair<>(1, 2); // compile error!

局限二:无法取得带泛型的Class。观察以下代码:

擦拭法 - 图1

因为TObject,我们对Pair<String>Pair<Integer>类型获取Class时,获取到的是同一个Class,也就是Pair类的Class

换句话说,所有泛型实例,无论T的类型是什么,getClass()返回同一个Class实例,因为编译后它们全部都是Pair<Object>

局限三:无法判断带泛型的类型:

  1. Pair<Integer> p = new Pair<>(123, 456);
  2. // Compile error:
  3. if (p instanceof Pair<String>) {
  4. }

原因和前面一样,并不存在Pair<String>.class,而是只有唯一的Pair.class

局限四:不能实例化T类型:

  1. public class Pair<T> {
  2. private T first;
  3. private T last;
  4. public Pair() {
  5. // Compile error:
  6. first = new T();
  7. last = new T();
  8. }
  9. }

上述代码无法通过编译,因为构造方法的两行语句:

  1. first = new T();
  2. last = new T();

擦拭后实际上变成了:

  1. first = new Object();
  2. last = new Object();

这样一来,创建new Pair<String>()和创建new Pair<Integer>()就全部成了Object,显然编译器要阻止这种类型不对的代码。

要实例化T类型,我们必须借助额外的Class<T>参数:

  1. public class Pair<T> {
  2. private T first;
  3. private T last;
  4. public Pair(Class<T> clazz) {
  5. first = clazz.newInstance();
  6. last = clazz.newInstance();
  7. }
  8. }

上述代码借助Class<T>参数并通过反射来实例化T类型,使用的时候,也必须传入Class<T>。例如:

  1. Pair<String> pair = new Pair<>(String.class);

因为传入了Class<String>的实例,所以我们借助String.class就可以实例化String类型。

不恰当的覆写方法

有些时候,一个看似正确定义的方法会无法通过编译。例如:

  1. public class Pair<T> {
  2. public boolean equals(T t) {
  3. return this == t;
  4. }
  5. }

这是因为,定义的equals(T t)方法实际上会被擦拭成equals(Object t),而这个方法是继承自Object的,编译器会阻止一个实际上会变成覆写的泛型方法定义。

换个方法名,避开与Object.equals(Object)的冲突就可以成功编译:

  1. public class Pair<T> {
  2. public boolean same(T t) {
  3. return this == t;
  4. }
  5. }

泛型继承

一个类可以继承自一个泛型类。例如:父类的类型是Pair<Integer>,子类的类型是IntPair,可以这么继承:

  1. public class IntPair extends Pair<Integer> {
  2. }

使用的时候,因为子类IntPair并没有泛型类型,所以,正常使用即可:

  1. IntPair ip = new IntPair(1, 2);

前面讲了,我们无法获取Pair<T>T类型,即给定一个变量Pair<Integer> p,无法从p中获取到Integer类型。

但是,在父类是泛型类型的情况下,编译器就必须把类型T(对IntPair来说,也就是Integer类型)保存到子类的class文件中,不然编译器就不知道IntPair只能存取Integer这种类型。

在继承了泛型类型的情况下,子类可以获取父类的泛型类型。例如:IntPair可以获取到父类的泛型类型Integer。获取父类的泛型类型代码比较复杂:

擦拭法 - 图2

因为Java引入了泛型,所以,只用Class来标识类型已经不够了。实际上,Java的类型系统结构如下:

  1. ┌────┐
  2. Type
  3. └────┘
  4. ┌────────────┬────────┴─────────┬───────────────┐
  5. ┌─────┐┌─────────────────┐┌────────────────┐┌────────────┐
  6. Class││ParameterizedType││GenericArrayType││WildcardType
  7. └─────┘└─────────────────┘└────────────────┘└────────────┘

小结

Java的泛型是采用擦拭法实现的;

擦拭法决定了泛型<T>

  • 不能是基本类型,例如:int
  • 不能获取带泛型类型的Class,例如:Pair<String>.class
  • 不能判断带泛型类型的类型,例如:x instanceof Pair<String>
  • 不能实例化T类型,例如:new T()

泛型方法要防止重复定义方法,例如:public boolean equals(T obj)

子类可以获取父类的泛型类型<T>

读后有收获可以支付宝请作者喝咖啡:

擦拭法 - 图3