1. 先了解一下HashCode
Java中的集合有兩類,一類是List,一類是Set。
List:元素有序,可以重復(fù);
Set:元素?zé)o序,不可重復(fù);
要想保證元素的不重復(fù),拿什么來(lái)判斷呢?這就是Object.equals方法了。如果元素有很多,增加一個(gè)元素,就要判斷n次嗎?
顯然不現(xiàn)實(shí),于是,Java采用了哈希表的原理。哈希算法也稱為散列算法,是將數(shù)據(jù)依特定算法直接指定到一根地址上,初學(xué)者可以簡(jiǎn)單的理解為,HashCode方法返回的就是對(duì)象存儲(chǔ)的物理位置(實(shí)際上并不是)。
這樣一來(lái),當(dāng)集合添加新的元素時(shí),先調(diào)用這個(gè)元素的hashcode()方法,就一下子能定位到他應(yīng)該放置的物理位置上。如果這個(gè)位置上沒(méi)有元素,他就可以直接存儲(chǔ)在這個(gè)位置上,不用再進(jìn)行任何比較了。如果這個(gè)位置上有元素,就調(diào)用它的equals方法與新元素進(jìn)行比較,想同的話就不存了,不相同就散列其它的地址。所以這里存在一個(gè)沖突解決的問(wèn)題。這樣一來(lái)實(shí)際上調(diào)用equals方法的次數(shù)就大大降低了,幾乎只需要一兩次。
簡(jiǎn)而言之,在集合查找時(shí),hashcode能大大降低對(duì)象比較次數(shù),提高查找效率。
Java對(duì)象的equals方法和hashCode方法時(shí)這樣規(guī)定的:
相等的對(duì)象就必須具有相等的hashcode。
如果兩個(gè)對(duì)象的hashcode相同,他們并不一定相同。
如果兩個(gè)對(duì)象的hashcode相同,他們并不一定相同。
如果兩個(gè)Java對(duì)象A和B,A和B不相等,但是A和B的哈希碼相等,將A和B都存入HashMap時(shí)會(huì)發(fā)生哈希沖突,也就是A和B存放在HashMap內(nèi)部數(shù)組的位置索引相同,這時(shí)HashMap會(huì)在該位置建立一個(gè)鏈接表,將A和B串起來(lái)放在該位置,顯然,該情況不違反HashMap的使用規(guī)則,是允許的。當(dāng)然,哈希沖突越少越好,盡量采用好的哈希算法避免哈希沖突。
equals()相等的兩個(gè)對(duì)象,hashcode()一定相等;equals()不相等的兩個(gè)對(duì)象,卻并不能證明他們的hashcode()不相等。
2. HashMap和HashSet的區(qū)別
HashSet 是如何保證不重復(fù)的?
向 HashSet 中 add ()元素時(shí),判斷元素是否存在的依據(jù),不僅要比較hash值,同時(shí)還要結(jié)合 equles 方法比較。
HashSet 中的 add ()方法會(huì)使用 HashMap 的 add ()方法。以下是 HashSet 部分源碼:
private static final Object PRESENT = new Object();
private transient HashMap<e,object> map;
public HashSet() {
map = new HashMap<>();
}
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
HashMap 的 key 是唯一的,由上面的代碼可以看出 HashSet 添加進(jìn)去的值就是作為 HashMap 的key。所以不會(huì)重復(fù)( HashMap 比較key是否相等是先比較 hashcode 在比較 equals )。
更多關(guān)于“Java培訓(xùn)”的問(wèn)題,歡迎咨詢千鋒教育在線名師。千鋒已有十余年的培訓(xùn)經(jīng)驗(yàn),課程大綱更科學(xué)更專業(yè),有針對(duì)零基礎(chǔ)的就業(yè)班,有針對(duì)想提升技術(shù)的好程序員班,高品質(zhì)課程助力你實(shí)現(xiàn)java程序員夢(mèng)想。