基于散列的集合中,HashMap應該是用的最多的鍵值對容器,既然用的這么頻繁,我覺得還是很有必要搞清楚原理,而寫出來,思路會更清晰。 先看下簡單的繼承體系: 從圖上看,繼承體系很簡單,2個標記性接口,然后就是作為Map的功能,很單純。 然后再來看看數據結構圖:
圖上一個空格就代表一個節點,而每個key-value對都保存在一個節點中,下面的代碼正式HashMap每個節點的數據結構。
static class Entry<K,V> implements Map.Entry<K,V> { final K key; V value; Entry<K,V> next; int hash; }
從數據結構圖判斷,HashMap中肯定維護著一個數組,用來存儲每個節點,現在就有2個問題,如何在數組中定位自己的位置(行話叫:桶),萬一桶被占用了怎么辦? 既然叫HashMap,通過名字大概能夠猜想得出了,是通過hash值來定位的,通過hash算出自己桶的位置,然而位置是有限的,那么通過函數映射(hash與數組長取模)到其中的位置時,必然的會出現沖突,解決沖突辦法,就如同上圖所示,鏈表法。 優化性能的設計 HashMap設計時候需要考慮速度的問題,鏈表連接的越長性能就越差,極端的例子,退化成單鏈表,時間復雜度O(N),這樣就失去了快速訪問的特性。 如果為了速度最快,最好的辦法就是沒有鏈表,既然是通過取模的方式進行定位,要達到最少沖突,肯定需要很長的數組,而數組越長,就越容易浪費。 為了達到理想的效果,又不浪費太多的空間,hashmap使用了一個閥值,當對象的數量達到閥值,才會進行擴容,這樣就能夠保證浪費的空間是在可控的有限范圍內。通過調節閥值,可以使得鏈表的鏈接的節點盡量的少。 如何定義閥值?hashmap中用了負載因子這么個概念,用數組的容量*負載因子作為閥值,默認負載因子是0.75。可以自行調整,但是一般不建議,優化有時候是個很棘手的問題,不成熟的優化是所有罪惡之源,最好的策略就是置之不顧,直到你發現真正需要優化他。
基于散列的集合,除了HashMap外,常用的還有HashSet、LinkedHashSet、LinkedHashMap。而這三個都是在HashMap的基礎上進行改造的,只要明白了HashMap的原理,其他的非常容易清楚。 HashSet 我們來簡單分析下,在jdk中的源碼:
public class HashSet<E> extends AbstractSet<E> implements Set<E>, Cloneable, java.io.Serializable{ static final long serialVersionUID = -5024744406713321676L; PRivate transient HashMap<E,Object> map; // Dummy value to associate with an Object in the backing Map private static final Object PRESENT = new Object(); /** * Constructs a new, empty set; the backing <tt>HashMap</tt> instance has * default initial capacity (16) and load factor (0.75). */ public HashSet() { map = new HashMap<>();//實例化時,同時實例化HashMap }上面是摘抄HashSet源碼的一段,發現沒,這是組合,是代理,用hashMap進行代理,下面最后列舉下最常用的功能:
public boolean add(E e) { return map.put(e, PRESENT)==null; //PRESENT為常量 } public Iterator<E> iterator() { return map.keySet().iterator(); }發了沒,是委托給HashMap的。 LinkedHashMap 估計 應該都知道,它既能擁有hashmap的速度,又能有序遍歷,直接看源碼:
public class LinkedHashMap<K,V> extends HashMap<K,V> implements Map<K,V>發現沒,是繼承自HashMap,可以說,復用了大部分的HashMap功能。 思考 :它是如何在hashmap的基礎上進行改造,使的元素有序? 我們先看下面這幅圖: 大家應該都知道了,左邊的是hashmap的元素節點,而右邊的正是LinkedHashMap的元素節點。發現多了什么了嗎?2個指針,指向前驅和指向后繼。想下,如果每個元素都能夠知道后面是誰,從頭開始按照順序進行元素遍歷,這個還難嗎?看下面創造節點的代碼:
看見沒,createEntry比hashmap多了一個重定位指針的操作。header節點中保存有第二個和最后一個節點的指針(不懂看上圖),保證有序,只需要把現有最后一個節點的after 指向本節點,就保證新加入的元素是有序,現有最后一個節點可以通過header.before獲取,同時為了下一次新加入節點能正常有序,需要把header的前節點重新地位到新的最后一個節點(也就是說header.before指向新節點)。這樣再通過after指針就能順藤摸瓜,順序遍歷了。 LinkedHashSet 看源碼:
public class LinkedHashSet<E> extends HashSet<E> implements Set<E>, Cloneable, java.io.Serializable {好像和我們想象的不一樣,不應該是LinkedHashMap嗎?不急繼續看其構造函數
public LinkedHashSet(int initialCapacity) { super(initialCapacity, .75f, true); } HashSet(int initialCapacity, float loadFactor, boolean dummy) { map = new LinkedHashMap<>(initialCapacity, loadFactor); }發現沒,HashSet這種構造方法用的是LinkedHashMap,現在還需要寫下去嗎,如同hashset復用hashMap原理一樣。
新聞熱點
疑難解答