52个有效方法(8) - 理解“对象等同性”这一概念
“等同性”(equality)
-
“等同性”(equality)在开发中时常作为逻辑判断的依据。
-
按照 “==”操作符比较,对于常规的数据类型比较是值,比如 9 == 9 ;对于对象的比较,使用 == 则比较的是两个指针本身,而不是其所指的对象。
判断等同性的关键方法
对于系统框架中的对象相等比较,我们可以使用NSObject协议中声明的“isEqual:”方法来判断两个对象的等同性。
//NSObject协议中有两个用于判断等同性的关键方法
- (BOOL)isEqual:(id)object;
- (NSUInteger)hash;
NSObject类对这两个方法的默认实现是:当且仅当其“指针值”(内存地址)完全相等时,这两个对象才相等。
-
如果"isEqual:"方法判定两个对象相等, 那么其hash方法也必须返回同一个值。
-
但是, 如果两个对象的hash方法返回同一个值, 那么"isEqual:" 方法未必会认为两者相等。
自定义"isEqual:"方法
@interface EOCPerson : NSObject
@property (nonatomic, copy) NSString *firstName;
@property (nonatomic, copy) NSString *lastName;
@property (nonatomic, assign) NSUInteger age;
@end
-(BOOL)isEqual:(id)object{
if (self == object) return YES;
if ([self class] != [object class]) return NO;
EOCPerson *otherPerson = (EOCPerson *)object;
if(![_firstName isEqualToString:otherPerson.firstName])
return NO;
if(![_lastName isEqualToString:otherPerson.lastName])
return NO;
if(_age != otherPerson.age)
return NO;
return YES;
}
- 实现hash方法(1)
- (NSUInteger)hash{
return 1337;
}
上面的写法,在collection中使用这种对象将产生性能问题, 因为collection在检索哈希表(hash table) 时, 会用对象的哈希码做索引。 假如某个collection 是用set 实现的,那么set可能会根据哈希码把对象分装到不同的数组中。在向set中添加新对象时, 要根据其哈希码找到与之相关的那个数组, 依次检查其中各个元素, 看数组中已有的对象是否和将要添加的新对象相等。如果相等, 那就说明要添加的对象已经在set里面了。 由此可知, 如果令每个对象都返回相同的哈希码, 那么在set中已有1000000个对象的情况下, 若是继续向其中添加对象, 则需将这 1000000个对象全部扫描一遍。
- 实现hash方法(2)
- (NSUInteger)hash {
NSString *stringToHash = [NSString stringWithFormat:@"%@:%@:%i",_firstName, _lastName, _age];
return [stringToHash hash];
}
这次所用的办法是将NSString对象中的属性都塞入另一个字符串中, 然后令hash方法返回该字符串的哈希码。这么做符合约定, 因为两个相等的EOCPerson对象总会返回相同的哈希码。但是这样做还需负担创建字符串的开销, 所以比返回单一值要慢。把这种对象添加到collection中时, 也会产生性能问题, 因为想要添加, 必须先计算其哈希码。
- 实现hash方法(3)
- (NSUInteger)hash {
NSUInteger firstNameHash = [_firstName hash];
NSUInteger lastNameHash = [_lastName hash];
NSUInteger ageHash = _age;
return firstNameHash ^ lastNameHash ^ ageHash;
}
这种做法既能保持较高效率, 又能使生成的哈希码至少位于一定范围之内, 而不会过于频繁地重复。当然, 此算法生成的哈希码还是会碰撞(collision), 不过至少可以保证哈希码有多种可能的取值. 编写hash方法时, 应该用当前的对象做实验, 以便在减少碰撞频度与降低运算复杂程度之间取舍。
- 编写hash方法时,应该使用计算速度快而且哈希码碰撞几率低的算法。
自定义等同性判定方法
如果经常需要判断等同性, 那么可能会自己来创建等同性判定方法, 因为无须检测参数类型, 所以能大大提升检测速度。
在编写判定方法时, 也应一并覆写"isEqual:"方法。后者的常见实现方式为: 如果受测的参数与接收该消息的对象都属于同一个类, 那么就调用自己编写的判定方法, 否则就交由超类来判断。
- (BOOL)isEqualToPerson:(EOCPerson *)otherPerson{
if (self == object) return YES;
if (![_firstName isEqualToString:otherPerson.firstName])
return NO;
if (![_lastName isEqualToString:otherPerson.lastName])
return NO;
if (_age != otherPerson.age)
return NO;
return YES;
}
- (BOOL)isEqual:(id)object{
if ([self class] == [object class]){
return [self isEqualToPerson:(EOCPerson *)object];
} else {
return [super isEqual:object];
}
}
特定类所具有的等同性判断方法
-
NSString类具有特殊的等同性判断方法"isEqualToString:"。
-
NSArray类具有特殊的等同性判断方法"isEqualToArray:"。
-
NSDictionary类具有特殊的等同性判断方法"isEqualToDictionary:"。
容器中可变类的等同性
容器中放入可变类对象的时候, 把某个对象放入collection之后, 就不应再改变其哈希码了。
collection会把各个对象按照其哈希码分装到不同的"箱子数组"中。如果某对象在放入"箱子"之后哈希码又变了, 那么其现在所处的这个箱子对它来说就是"错误"的。
//1. 把一个数组加入set中
NSMutableSet *set = [NSMutableSet new];
NSMutableArray *arrayA = [@[@1, @2] mutableCopy];
[set addObject:arrayA];
NSLog(@“set = %@“,set);
// set = {((1,2))}
//2. 再向set加入一个数组,此数组与前一个数组所含的对象相同,顺序也相同
NSMutableArray *arrayB = [@[@1, @2] mutableCopy];
[set addObject:arrayB];
NSLog(@“set = %@“,set);
// set = {((1,2))}
//3. 此时仍只有一个对象,因为刚才要加入的那个数组对象和set中已有的数组对象相等,所以set并不会改变
NSMutableArray *arrayC = [@[@1] mutableCopy];
[set addObject:arrayC];
NSLog(@“set = %@“,set);
// set = {((1),(1,2))}
//4. 然后我们再改变arrayC的内容
[arrayC addObject:@2];
NSLog(@“set = %@“,set);
// set = {((1,2),(1,2))}
//5. 此时set中就包含了两个彼此相等的数组,根据set语义是不允许出现这种情况的。然后现在却无法保证这一点。
//6. 若是拷贝此set
NSSet *setB = [set copy];
NSLog(@“setB = %@“,setB);
// setB = {((1,2))}
//所以说,如果把某个对象放入set后又修改其内容,那么后面的行为将很难预测
所以容器里的对象应该是不可改变的。
要点:
-
要想检测对象的等同性,请提供“isEqual:”与hash方法。
-
相同的对象必须具有相同的哈希码,但是两个哈希码相同的对象未必相同。
-
不要盲目地逐个检测每条属性,而是应该依照具体需求来定制检测方案。
-
编写hash方法时,应该使用计算速度快而且哈希码碰撞几率低的算法。