2分pk10输钱 _为什么要重写hashcode和equals方法?初级程序员在面试中很少能说清楚。

  • 时间:
  • 浏览:3

     我在面试 Java初级开发的后要 ,总是 会问:你有如此 重写过hashcode办法 ?不少候选人直接说没写过。让我想,或许真的没写过,于是就再通过另四个问题图片确认:你在用HashMap的后要 ,键(Key)主次,有如此 放过自定义对象?而这名后要 ,候选人说放过,于是另四个问题图片的回答就自相矛盾了。

    最近问下来,这名问题图片普遍回答不大好,于是在本文里,就干脆从hash表讲起,讲述HashMap的存数据规则,由此人们就自然清楚上述问题图片的答案了。

1 通过Hash算法来了解HashMap对象的高效性

    人们先复习数据社会形态里的另四个知识点:在另四个长度为n(假设是300000)的线性表(假设是ArrayList)里,存放着无序的数字;后要 人们要找另四个指定的数字,就不得不通过从头到尾依次遍历来查找,另四个的平均查找次数是n除以2(这里是300000)。

人们再来观察Hash表(这里的Hash表纯粹是数据社会形态上的概念,和Java无关)。它的平均查找次数接近于1,代价相当小,关键是在Hash表里,存倒入其中的数据和它的存储位置是用Hash函数关联的。

    人们假设另四个Hash函数是x*x%5。当然实际情况表里不后要 用如此 简单的Hash函数,人们这里纯粹为了说明方便,而Hash表是另四个长度是11的线性表。后要 人们要把6倒入其中,如此 人们首先会对6用Hash函数计算一下,结果是1,统统统统人们就把6倒入到索引号是1这名位置。同样后要 人们要放数字7,经过Hash函数计算,7的结果是4,如此 它将被倒入索引是4的这名位置。这名效果如下图所示。

    另四个做的好处非常明显。比如人们要从中找6这名元素,人们可不时需先通过Hash函数计算6的索引位置,要怎样让直接从1号索引里找到它了。

不过人们会遇到“Hash值冲突”这名问题图片。比如经过Hash函数计算后,7和8会有相同的Hash值,对此Java的HashMap对象采用的是”链地址法“的防止方案。效果如下图所示。

 

    具体的做法是,为所有Hash值是i的对象建立另四个同义词链表。假设人们在倒入8的后要 ,发现4号位置后要 被占,如此 就会新建另四个链表结点倒入8。同样,后要 人们要找8,如此 发现4号索引里全部一定会8,那会沿着链表依次查找。

    嘴笨 人们还是无法彻底防止Hash值冲突的问题图片,要怎样让Hash函数设计合理,仍能保证同义词链表的长度被控制在另四个合理的范围里。这里讲的理论知识并是是否是无的放矢,人们能在后文里清晰地了解到重写hashCode办法 的重要性。

2 为那先 要重写equals和hashCode办法

    当人们用HashMap存入自定义的类时,后要 不重写这名自定义类的equals和hashCode办法 ,得到的结果会和人们预期的不一样。人们来看WithoutHashCode.java这名例子。

在其中的第2到第18行,人们定义了另四个Key类;在其中的第3行定义了唯一的另四个属性id。当前人们先注释掉第9行的equals办法 和第16行的hashCode办法 。    

1	import java.util.HashMap;
2	class Key {
3		private Integer id;
4		public Integer getId() 
5	{return id; }
6		public Key(Integer id) 
7	{this.id = id;	}
8	//故意先注释掉equals和hashCode办法

9	//	public boolean equals(Object o) {
10	//		if (o == null || !(o instanceof Key)) 
11	//		{ return false;	} 
12	//		else 
13	//		{ return this.getId().equals(((Key) o).getId());}
14	//	}
15		
16	//	public int hashCode() 
17	//	{ return id.hashCode();	}
18	}
19	
20	public class WithoutHashCode {
21		public static void main(String[] args) {
22			Key k1 = new Key(1);
23			Key k2 = new Key(1);
24			HashMap<Key,String> hm = new HashMap<Key,String>(); 
25			hm.put(k1, "Key with id is 1");		
26			System.out.println(hm.get(k2));		
27		}
28	}

    在main函数里的第22和23行,人们定义了另四个Key对象,它们的id全部一定会1,就好比它们是两把相同的都能打开同一扇门的钥匙。

    在第24行里,人们通过泛型创建了另四个HashMap对象。它的键主次可不时需存放Key类型的对象,值主次可不时需存储String类型的对象。

    在第25行里,人们通过put办法 把k1和一串字符倒入到hm里; 而在第26行,人们想用k2去从HashMap里得到值;这就好比人们想用k1这把钥匙来锁门,用k2来开门。这是符合逻辑的,但从当前结果看,26行的返回结果全部一定会人们想象中的那个字符串,本来null。

    原应另四个—如此 重写。第一是如此 重写hashCode办法 ,第二是如此 重写equals办法 。

   当人们往HashMap里放k1时,首先会调用Key这名类的hashCode办法 计算它的hash值,后要把k1倒入hash值所指引的内存位置。

    关键是人们如此 在Key里定义hashCode办法 。这里调用的仍是Object类的hashCode办法 (所有的类全部一定会Object的子类),而Object类的hashCode办法 返回的hash值嘴笨 是k1对象的内存地址(假设是30000)。

    

    后要 人们后本来调用hm.get(k1),如此 人们会再次调用hashCode办法 (还是返回k1的地址30000),后要根据得到的hash值,能很慢地找到k1。

    但人们这里的代码是hm.get(k2),当人们调用Object类的hashCode办法 (后要 Key里没定义)计算k2的hash值时,嘴笨 得到的是k2的内存地址(假设是30000)。后要 k1和k2是另四个不同的对象,统统统统它们的内存地址一定无需相同,也本来说它们的hash值一定不同,这本来人们无法用k2的hash值去拿k1的原应。

    当人们把第16和17行的hashCode办法 的注释上加后,会发现它是返回id属性的hashCode值,这里k1和k2的id全部一定会1,统统统统它们的hash值是相等的。

    人们再来更正一下存k1和取k2的动作。存k1时,是根据它id的hash值,假设这里是3000,把k1对象倒入到对应的位置。而取k2时,是先计算它的hash值(后要 k2的id也是1,这名值也是3000),后要到这名位置去找。

    但结果会出乎人们意料:明明3000号位置后要 有k1,但第26行的输出结果依然是null。其原应本来如此 重写Key对象的equals办法 。

    HashMap是用链地址法来防止冲突,也本来说,在3000号位置上,有后要 所处着多个用链表形式存储的对象。它们通过hashCode办法 返回的hash值全部一定会3000。

     当人们通过k2的hashCode到3000号位置查找时,嘴笨 会得到k1。但k1有后要 仅仅是和k2具有相同的hash值,但并是是否是和k2相等(k1和k2两把钥匙并是是否是能开同一扇门),这名后要 ,就时需调用Key对象的equals办法 来判断两者是是否是相等了。

    后要 人们在Key对象里如此 定义equals办法 ,系统就不得不调用Object类的equals办法 。后要 Object的固有办法 是根据另四个对象的内存地址来判断,统统统统k1和k2一定无需相等,这本来为那先 依然在26行通过hm.get(k2)依然得到null的原应。

    为了防止这名问题图片,人们时需打开第9到14行equals办法 的注释。在这名办法 里,本来另四个对象全部一定会Key类型,要怎样让它们的id相等,它们就相等。

3 对面试问题图片的说明

    后要 在项目里总是 会用到HashMap,统统统统我在面试的后要 一定会问这名问题图片∶你有如此 重写过hashCode办法 ?你在使用HashMap时有如此 重写hashCode和equals办法 ?你是为什么么么会写的?

    根据问下来的结果,我发现初级程序员对这名知识点普遍没掌握好。重申一下,后要 人们要在HashMap的“键”主次存放自定义的对象,一定要在这名对象里用另一方的equals和hashCode办法 来覆盖Object里的同名办法 。 

     本文是从Java核心技术及面试指南这本书中相关内容改编而来。