新闻资讯
100%会用到的hashCode()和equals()方法及使用规范,你掌握了吗?
背景
在看阿里巴巴Java开发手册手册时,看到了有关hashCode()和equals()方法的使用规范。
- 只要重写 equals,就必须重写 hashCode。
- 因为 Set 存储的是不重复的对象,依据 hashCode 和 equals 进行判断,所以 Set 存储的对象必须重写这两个方法。
- 如果自定义对象做为 Map 的键,那么必须重写 hashCode 和 equals。
并且举了String 重写了 hashCode 和 equals 方法,所以我们可以非常愉快地使用 String 对象作为 key 来使用的例子。
我们看下String的hashCode()和equals()的源码:
String的hashCode()
hashCode():
代码就不一行一行的解释了,单纯的从代码角度上来说,我们也可以学到一些知识点。
- 缓存的重要性,这里的value属性就作为了缓存。
- 大多数情况下缓存是在使用时生成的。
- 计算hash时可以用类本身的属性的值与31乘积。
为什么是31,而不是32,33等其他数字呢?
- 31是一个素数,素数作用就是如果我用一个数字来乘以这个素数,那么最终的出来的结果只能被素数本身和被乘数还有1来整除。
- 31可以由i*31 == (i<<5)-1来表示,现在很多虚拟机里面都有做相关优化。
- 选择系数的时候要选择尽量大的系数。因为如果计算出来的hash地址越大,所谓的“冲突”就越少,查找起来效率也会提高。
- 并且31只占用5bits,相乘造成数据溢出的概率较小。
后面再说hashCode的设计原则,继续介绍equals()方法。
String的equals()
equals方法就没有什么好说的,为什么要这么写,这里就跟equals的设计原则有关了,后续会解释。下面我们从开发者手册的三句话来解释hashCode和equals方法的特性,以及为什么要重新这两个方法。往期面试题:001期~180期汇总
我们先举个例子: Person类:
运行类:
输出结果:
可以看出来p1虽然等于p2(我们重写了Person类的equals方法),但是把p1放入一个Set之后,通过p2是无法取出来的,但是我们要的效果是能通过p2取出来,现实中肯定是有这样的使用场景的。
因为 Set 存储的是不重复的对象,依据 hashCode 和 equals 进行判断,所以 Set 存储的对象必须重写这两个方法
还是上面的例子,我们不重写Person类的equals方法,也不重写它的hashCode方法。Person类: 运行类: 运行结果:Set里面是不重复的,如果不重写Person类的hashCode和equals方法,这里p1和p2是可以同时放入Set对象里的。那么我们只重写了Person的hashCode方法能不能行呢?
运行结果: 最后重写Person类的equals()方法: 运行结果:如果自定义对象做为 Map 的键,那么必须重写 hashCode() 和 equals()
equals()的设计原则
- 对称性: 如果x.equals(y)返回是true,那么y.equals(x)也应该返回是true。
- 反射性: x.equals(x)必须返回是true。
- 类推性: 如果x.equals(y)返回是true,而且y.equals(z)返回是true,那么z.equals(x)也应该返回是true。
- 一致性: 如果x.equals(y)返回是true,只要x和y内容一直不变,不管你重复x.equals(y)多少次,返回都是true。
- 非空性: x.equals(null),永远返回是false;x.equals(和x不同类型的对象)永远返回是false。
hashCode()的设计原则
- 在一个Java应用的执行期间,如果一个对象提供给equals做比较的信息没有被修改的话,该对象多次调用hashCode()方法,该方法必须始终如一返回同一个integer。
- 如果两个对象根据equals(Object)方法是相等的,那么调用二者各自的hashCode()方法必须产生同一个integer结果。
- 并不要求根据equals(java.lang.Object)方法不相等的两个对象,调用二者各自的hashCode()方法必须产生不同的integer结果。然而,程序员应该意识到对于不同的对象产生不同的integer结果,有可能会提高hash table的性能。
回复列表