Java 泛型进阶
擦除
在泛型代码内部,无法获得任何有关泛型参数类型的信息。
例子1:
//这个例子表明编译过程中并没有根据参数生成新的类型
public class Main2 {
public static void main(String[] args) {
Class c1 = new ArrayList<Integer>().getClass();
Class c2 = new ArrayList<String>().getClass();
System.out.print(c1 == c2);
}
}
/* output
true
*/
在 List<String>
中添加 Integer
将不会通过编译,但是List<Sring>
与List<Integer>
在运行时的确是同一种类型。
例子2:
//例子, 这个例子表明类的参数类型跟传进去的类型没有关系,泛型参数只是`占位符`
public class Table {
}
public class Room {
}
public class House<Q> {
}
public class Particle<POSITION, MOMENTUM> {
}
public class Main {
public static void main(String[] args) {
List<Table> tableList = new ArrayList<Table>();
Map<Room, Table> maps = new HashMap<Room, Table>();
House<Room> house = new House<Room>();
Particle<Long, Double> particle = new Particle<Long, Double>();
System.out.println(Arrays.toString(tableList.getClass().getTypeParameters()));
System.out.println(Arrays.toString(maps.getClass().getTypeParameters()));
System.out.println(Arrays.toString(house.getClass().getTypeParameters()));
System.out.println(Arrays.toString(particle.getClass().getTypeParameters()));
}
}
/** output
[E]
[K, V]
[Q]
[POSITION, MOMENTUM]
*/
我们在运行期试图获取一个已经声明的类的类型参数,发现这些参数依旧是‘形参’,并没有随声明改变。也就是说在运行期,我们是拿不到已经声明的类型的任何信息。
编译器会虽然在编译过程中移除参数的类型信息,但是会保证类或方法内部参数类型的一致性。
例子:
List<String> stringList=new ArrayList<String>();
//可以通过编译
stringList.add("wakaka");
//编译不通过
//stringList.add(new Integer(0));
//List.java
public interface List<E> extends Collection<E> {
//...
boolean add(E e);
//...
}
List
的参数类型是E
,add
方法的参数类型也是E
,他们在类的内部是一致的,所以添加Integer
类型的对象到stringList
违反了内部类型一致,不能通过编译。
重用 extends
关键字。通过它能给与参数类型添加一个边界。
泛型参数将会被擦除到它的第一个边界(边界可以有多个)。编译器事实上会把类型参数替换为它的第一个边界的类型。如果没有指明边界,那么类型参数将被擦除到Object
。下面的例子中,可以把泛型参数T当作HasF类型来使用。
例子:
/** * Created by yxf on 16-5-28. */
// HasF.java
public interface HasF {
void f();
}
//Manipulator.java
public class Manipulator<T extends HasF> {
T obj;
public T getObj() {
return obj;
}
public void setObj(T obj) {
this.obj = obj;
}
}
extend
关键字后后面的类型信息决定了泛型参数能保留的信息。
Java中擦除的基本原理
刚看到这里可能有些困惑,一个泛型类型没有保留具体声明的类型的信息,那它是怎么工作的呢?在把《Java编程思想》书中这里的边界与上文的边界区分开来之后,终于想通了。Java的泛型类的确只有一份字节码,但是在使用泛型类的时候编译器做了特殊的处理。
这里根据作者的思路,自己动手写了两个类SimpleHolder
和GenericHolder
,然后编译拿到两个类的字节码,直接贴在这里:
// SimpleHolder.java
public class SimpleHolder {
private Object obj;
public Object getObj() {
return obj;
}
public void setObj(Object obj) {
this.obj = obj;
}
public static void main(String[] args) {
SimpleHolder holder = new SimpleHolder();
holder.setObj("Item");
String s = (String) holder.getObj();
}
}
// SimpleHolder.class
public class SimpleHolder {
public SimpleHolder();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public java.lang.Object getObj();
Code:
0: aload_0
1: getfield #2 // Field obj:Ljava/lang/Object;
4: areturn
public void setObj(java.lang.Object);
Code:
0: aload_0
1: aload_1
2: putfield #2 // Field obj:Ljava/lang/Object;
5: return
public static void main(java.lang.String[]);
Code:
0: new #3 // class SimpleHolder
3: dup
4: invokespecial #4 // Method "<init>":()V
7: astore_1
8: aload_1
9: ldc #5 // String Item
11: invokevirtual #6 // Method setObj:(Ljava/lang/Object;)V
14: aload_1
15: invokevirtual #7 // Method getObj:()Ljava/lang/Object;
18: checkcast #8 // class java/lang/String
21: astore_2
22: return
}
//GenericHolder.java
public class GenericHolder<T> {
T obj;
public T getObj() {
return obj;
}
public void setObj(T obj) {
this.obj = obj;
}
public static void main(String[] args) {
GenericHolder<String> holder = new GenericHolder<>();
holder.setObj("Item");
String s = holder.getObj();
}
}
//GenericHolder.class
public class GenericHolder<T> {
T obj;
public GenericHolder();
Code:
0: aload_0
1: invokespecial #1 // Method java/lang/Object."<init>":()V
4: return
public T getObj();
Code:
0: aload_0
1: getfield #2 // Field obj:Ljava/lang/Object;
4: areturn
public void setObj(T);
Code:
0: aload_0
1: aload_1
2: putfield #2 // Field obj:Ljava/lang/Object;
5: return
public static void main(java.lang.String[]);
Code:
0: new #3 // class GenericHolder
3: dup
4: invokespecial #4 // Method "<init>":()V
7: astore_1
8: aload_1
9: ldc #5 // String Item
11: invokevirtual #6 // Method setObj:(Ljava/lang/Object;)V
14: aload_1
15: invokevirtual #7 // Method getObj:()Ljava/lang/Object;
18: checkcast #8 // class java/lang/String
21: astore_2
22: return
}
经过一番比较之后,发现两分源码虽然不同,但是对应的字节码逻辑部分确是完全相同的。
在编译过程中,类型变量的信息是能拿到的。所以,set
方法在编译器可以做类型检查,非法类型不能通过编译。但是对于get
方法,由于擦除机制,运行时的实际引用类型为Object
类型。为了‘还原’返回结果的类型,编译器在get
之后添加了类型转换。所以,在GenericHolder.class
文件main
方法主体第18行有一处类型转换的逻辑。它是编译器自动帮我们加进去的。
所以在泛型类对象读取和写入的位置为我们做了处理,为代码添加约束。
擦除的缺陷
泛型类型不能显式地运用在运行时类型的操作当中,例如:转型、instanceof
和 new
。因为在运行时,所有参数的类型信息都丢失了。
public class Erased<T> {
private final int SIZE = 100;
public static void f(Object arg) {
//编译不通过
if (arg instanceof T) {
}
//编译不通过
T var = new T();
//编译不通过
T[] array = new T[SIZE];
//编译不通过
T[] array = (T) new Object[SIZE];
}
}
擦除的补偿
1. 类型判断问题
例子:
class Building {}
class House extends Building {}
public class ClassTypeCapture<T> {
Class<T> kind;
public ClassTypeCapture(Class<T> kind) {
this.kind = kind;
}
public boolean f(Object arg) {
return kind.isInstance(arg);
}
public static void main(String[] args) {
ClassTypeCapture<Building> ctt1 = new ClassTypeCapture<Building>(Building.class);
System.out.println(ctt1.f(new Building()));
System.out.println(ctt1.f(new House()));
ClassTypeCapture<House> ctt2 = new ClassTypeCapture<House>(House.class);
System.out.println(ctt2.f(new Building()));
System.out.print(ctt2.f(new House()));
}
}
//output
//true
//true
//false
//true
泛型参数的类型无法用instanceof
关键字来做判断。所以我们使用类类型来构造一个类型判断器,判断一个实例是否为特定的类型。
2. 创建类型实例
Erased.java
中不能new T()
的原因有两个,一是因为擦除,不能确定类型;而是无法确定T
是否包含无参构造函数。
为了避免这两个问题,我们使用显式的工厂模式:
例子:
interface IFactory<T> {
T create();
}
class Foo2<T> {
private T x;
public <F extends IFactory<T>> Foo2(F factory) {
x = factory.create();
}
}
class IntegerFactory implements IFactory<Integer> {
@Override
public Integer create() {
return new Integer(0);
}
}
class Widget {
public static class Factory implements IFactory<Widget> {
@Override
public Widget create() {
return new Widget();
}
}
}
public class FactoryConstraint {
public static void main(String[] args) {
new Foo2<Integer>(new IntegerFactory());
new Foo2<Widget>(new Widget.Factory());
}
}
通过特定的工厂类实现特定的类型能够解决实例化类型参数的需求。
3. 创建泛型数组
一般不建议创建泛型数组。尽量使用ArrayList
来代替泛型数组。但是在这里还是给出一种创建泛型数组的方法。
public class GenericArrayWithTypeToken<T> {
private T[] array;
@SuppressWarnings("unchecked")
public GenericArrayWithTypeToken(Class<T> type, int sz) {
array = (T[]) Array.newInstance(type, sz);
}
public void put(int index, T item) {
array[index] = item;
}
public T[] rep() {
return array;
}
public static void main(String[] args) {
GenericArrayWithTypeToken<Integer> gai = new GenericArrayWithTypeToken<Integer>(Integer.class, 10);
Integer[] ia = gai.rep();
}
}
这里我们使用的还是传参数类型,利用类型的newInstance
方法创建实例的方式。
边界
这里Java重用了 extend
关键字。边界可以将类型参数的范围限制到一个子集当中。
interface HasColor {
Color getColor();
}
class Colored<T extends HasColor> {
T item;
public Colored(T item) {
this.item = item;
}
public T getItem() {
return item;
}
public Color color() {
return item.getColor();
}
}
class Dimension {
public int x, y, z;
}
class ColoredDemension<T extends HasColor & Dimension> {
T item;
public ColoredDemension(T item) {
this.item = item;
}
public T getItem() {
return item;
}
Color color() {
return item.getColor();
}
int getX() {
return item.x;
}
int getY() {
return item.y;
}
int getZ() {
return item.z;
}
}
interface Weight {
int weight();
}
class Solid<T extends Dimension & HasColor & Weight> {
T item;
public Solid(T item) {
this.item = item;
}
public T getItem() {
return item;
}
Color color() {
return item.getColor();
}
int getX() {
return item.x;
}
int getY() {
return item.y;
}
int getZ() {
return item.z;
}
int weight() {
return item.weight();
}
}
class Bounded extends Dimension implements HasColor, Weight {
@Override
public Color getColor() {
return null;
}
@Override
public int weight() {
return 0;
}
}
public class BasicBound {
public static void main(String[] args) {
Solid<Bounded> solid = new Solid<Bounded>(new Bounded());
solid.color();
solid.weight();
solid.getZ();
}
}
extends关键字声明中,有两个要注意的地方:
- 类必须要写在接口之前;
- 只能设置一个类做边界,其它均为接口。
通配符
协变:
public class Holder<T> {
private T value;
public Holder(T apple) {
}
public T getValue() {
return value;
}
public void setValue(T value) {
this.value = value;
}
@Override
public boolean equals(Object o) {
return value != null && value.equals(o);
}
public static void main(String[] args) {
Holder<Apple> appleHolder = new Holder<Apple>(new Apple());
Apple d = new Apple();
appleHolder.setValue(d);
// 不能自动协变
// Holder<Fruit> fruitHolder=appleHolder;
// 借助 ? 通配符和 extends 关键字可以实现协变
Holder<? extends Fruit> fruitHolder = appleHolder;
// 返回一个Fruit,因为添加边界之后返回的对象是 ? extends Fruit,
// 可以把它转型为Apple,但是在不知道具体类型的时候存在风险
d = (Apple) fruitHolder.getValue();
//Fruit以及Fruit的父类,就不需要转型
Fruit fruit = fruitHolder.getValue();
Object obj = fruitHolder.getValue();
try {
Orange c = (Orange) fruitHolder.getValue();
} catch (Exception e) {
System.out.print(e);
}
// 编译不通过,因为编译阶段根本不知道子类型到底是什么类型
// fruitHolder.setValue(new Apple());
// fruitHolder.setValue(new Orange());
//这里是可以的因为equals方法接受的是Object作为参数,并不是 ? extends Fruit
System.out.print(fruitHolder.equals(d));
}
}
在Java中父类型可以持有子类型。如果一个父类的容器可以持有子类的容器,那么我们就可以称为发生了协变。在java中,数组是自带协变的,但是泛型的容器没有自带协变。我们可以根据利用边界和通配符?
来实现近似的协变。
Holder<? extends Fruit>
就是一种协变的写法。它表示一个列表,列表持有的类型是Fruit
或其子类。
这个Holder<? extends Fruit>
运行时持有的类型是未知的,我们只知道它一定是Fruit
的子类。正因为如此,所以我们无法向这个holder
中放入任何类型的对象,Object
类型的对象也不可以。但是,调用它的返回方法却是可以的。因为边界明确定义了它是Fruit
类型的子类。
逆变:
package wildcard;
import java.util.ArrayList;
import java.util.List;
public class GenericWriting {
static <T> void writeExact(List<T> list, T item) {
list.add(item);
}
static List<Apple> apples = new ArrayList<Apple>();
static List<Fruit> fruits = new ArrayList<Fruit>();
static void f1() {
writeExact(apples, new Apple());
//this cannot be compile,said in Thinking in Java
writeExact(fruits, new Apple());
}
static <T> void writeWithWildcard(List<? super T> list, T item) {
list.add(item);
}
static void f2() {
writeWithWildcard(apples, new Apple());
writeWithWildcard(fruits, new Apple());
}
static <T> readWithWildcard(List<? super T> list, int index) {
//Compile Error, required T but found Object
return list.get(index);
}
public static void main(String[] args) {
f1();
f2();
}
}
如果一个类的父类型容器可以持有该类的子类型的容器,我们称这种关系为逆变。声明方式List<? super Integer>
, List<? super T> list
。
不能给泛型参数给出一个超类型边界;即不能声明List<T super MyClass>
。
上面的例子中,writeExact(fruits,new Apple());
在《Java编程思想》中说是不能通过编译的,但我试了一下,在Java1.6,Java1.7中是可以编译的。不知道是不是编译器比1.5版本升级了。
由于给出了参数类型的‘下界’,所以我们可以在列表中添加数据而不会出现类型错误。但是使用get方法获取返回类型的时候要注意,由于声明的类型区间是Object到T具有继承关系的类。所以返回的类型为了确保没有问题,都是以Object类型返回回来的。比如过例子中list.get(index)
的返回类型就是Object
。
无界通配符
无界通配符<?>
意味着可以使用任何对象,因此使用它类似于使用原生类型。但它是有作用的,原生类型可以持有任何类型,而无界通配符修饰的容器持有的是某种具体的类型。举个例子,在List<?>
类型的引用中,不能向其中添加Object
, 而List
类型的引用就可以添加Object
类型的变量。
一些需要注意的问题
1. 任何基本类型都不能作为类型参数
2. 实现参数化接口
例子:
interface Payable<T>{}
class Employee implements Payable<Employee> {}
//Compile Error
class Hourly extends Employee implements Payable<Hourly> {}
因为擦除的原因,Payable<Employee>
与 Payable<Hourly>
简化为相同的Payable<Object>
,例子中的代码意味着重复两次实现相同的接口。但他们的参数类型却是不相同的。
3. 转型和警告
使用带有泛型类型参数的转型或者instanceof
不会有任何效果。因为他们在运行时都会被擦除到上边界上。所以转型的时候用的类型实际上是上边解对应的类型。
4. 重载
//Compile Error. 编译不能通过
public class UseList<W,T>{
void f(List<T> v){}
void f(List<W> v){}
}
由于擦除的原因,重载方法将产生相同的类型签名。避免这种问题的方法就是换个方法名。
5. 基类劫持接口
例子:
public class ComparablePet implements Comparable<ComparablePet>{
public int compareTo(ComparablePet arg) {return 0;}
}
class Cat extends ComparablePet implements Comparable<Cat>{
// Error: Comparable connot be inherited with
// different arguments: <Cat> and <ComparablePet>
public int compareTo(Cat arg);
}
父类中我们为Comparable
确定了ComparablePet
参数,那么其它任何类型都不能再与ComparablePet
之外的对象再比较。子类中不能对同一个接口用不同的参数实现两次。这有点类似于第四点中的重载。
但是我们可以在子类中覆写父类中的方法。
关于泛型问题就先了解这么多,有什么不对的地方还请大家指正。也欢迎小伙伴们一起交流。