HashMap

2019-11-14 09:41:09

字體：大中小

來源：轉載

供稿：網友

HashMap繼承于AbstractMap，實現了Map接口，同時標記了Cloneable和Serializable接口。

public class HashMap<K,V> extends AbstractMap<K,V> implements Map<K,V>, Cloneable, Serializable

構造函數

HashMap提供了四個構造函數： (1) HashMap()：構造一個初始容量為16和加載因子為0.75的空HashMap。 (2) HashMap(int initialCapacity)：構造一個帶指定初始容量和默認加載因子0.75的空HashMap。 (3) HashMap(int initialCapacity, float loadFactor)：構造一個帶指定初始容量和指定加載因子的空HashMap。 (4) HashMap(Map

public HashMap(Map<? extends K, ? extends V> m) { this(Math.max((int) (m.size() / DEFAULT_LOAD_FACTOR) + 1, DEFAULT_INITIAL_CAPACITY), DEFAULT_LOAD_FACTOR); inflateTable(threshold); putAllForCreate(m); } PRivate void inflateTable(int toSize) { // Find a power of 2 >= toSize，計算出大于toSize的最小的2的n次方值。 int capacity = roundUpToPowerOf2(toSize); // 設置HashMap的容量極限，當HashMap的容量達到該極限時就會進行擴容操作 threshold = (int) Math.min(capacity * loadFactor, MAXIMUM_CAPACITY + 1); // 初始化table數組 table = new Entry[capacity]; // Initialize the hashing mask value. We defer initialization until we really need it. initHashSeedAsNeeded(capacity); }

初始容量是創建哈希表時的桶的數量， 加載因子是哈希表容量擴展前可以達到多滿的一種尺度，它衡量的是一個散列表的空間的使用程度。負載因子越大，表示散列表的裝填程度越高、對空間的利用更充分，后果卻是查找效率的降低；而負載因子太小，那么散列表的數據將過于稀疏，對空間的利用存在著浪費。

數據結構

從構造函數中可以看出，HashMap本質是一個table數組，table數組里的元素是Entry鏈表。Entry為HashMap的內部類，它包含了鍵key、值value、下一個節點next以及hash值，正是由于Entry才構成了table數組的項為鏈表。

static class Entry<K,V> implements Map.Entry<K,V> { final K key; V value; Entry<K,V> next; int hash; /** * Creates new entry. */ Entry(int h, K k, V v, Entry<K,V> n) { value = v; next = n; key = k; hash = h; } // 部分源碼略去

put(K key, V value)

put(K key, V value)方法的源碼如下。基本過程是： 1. 判斷key是否為null，若為null，則直接調用putForNullKey方法。 2. key不為空則計算key的hash值，再根據hash值搜索key落在哪個桶上。 3. 對該桶上的Entry鏈表進行遍歷，如果該鏈表上存在相同的key，則覆蓋原來key的value，否則將該元素保存在鏈頭（最先保存的元素放在鏈尾）。

public V put(K key, V value) { if (table == EMPTY_TABLE) { inflateTable(threshold); } // 當key為null，調用putForNullKey方法，保存null到table的第一個位置，這就是HashMap允許為null的原因 if (key == null) return putForNullKey(value); // 計算key的hash值 int hash = hash(key); // 計算key的hash值在table數組中的位置，即落在哪一個桶上 int i = indexFor(hash, table.length); // 迭代該桶上的Entry鏈表,找到key保存的位置 for (Entry<K,V> e = table[i]; e != null; e = e.next) { Object k; // 判斷該鏈表上是否有相同的hash值和相同的key（僅僅判斷hash值是否相同是不夠的） if (e.hash == hash && ((k = e.key) == key || key.equals(k))) { // 若存在相同，則直接覆蓋value，返回舊value V oldValue = e.value; e.value = value; e.record access(this); return oldValue; } } //修改次數增加1 modCount++; // 該鏈表上不存在相同的hash值和key，則將key、value添加至i位置處 addEntry(hash, key, value, i); return null; }

以上的存儲機制也解釋了HashSet是如何保證元素唯一性的。

這里需要強調下indexFor方法。HashMap就是通過該方法實現均勻分布table數據和充分利用空間的。初始化時，我們保證了capacity是大于初始容量的最小的2的n次方值。當length = 2^n時，不同的hash值發生碰撞的概率比較小，從而數據在table數組中分布較均勻，查詢速度也較快。

/** * Returns index for hash code h. */ static int indexFor(int h, int length) { // assert Integer.bitCount(length) == 1 : "length must be a non-zero power of 2"; return h & (length-1); }

最后看一下鏈的產生和擴容問題。 1. 鏈的產生：系統總是將新創建的Entry放入bucketIndex索引處。如果bucketIndex處已經有了對象，那么新添加的Entry對象將指向原有的Entry對象，形成一條Entry鏈；如果bucketIndex處還沒有Entry對象，那么新添加的Entry對象將指向null。在table數組未擴容的情況下，兩個元素的hash值相同，就意味著它們會在同一個桶上。 2. 擴容問題：當HashMap中元素的數量等于table數組長度*加載因子，就會觸發擴容操作。擴容操作需盡量避免，因為它需要重新計算這些元素在新table數組中的位置并進行復制處理。

void addEntry(int hash, K key, V value, int bucketIndex) { // 若HashMap中元素的個數超過極限了，則容量擴大兩倍 if ((size >= threshold) && (null != table[bucketIndex])) { resize(2 * table.length); hash = (null != key) ? hash(key) : 0; bucketIndex = indexFor(hash, table.length); } createEntry(hash, key, value, bucketIndex); } void createEntry(int hash, K key, V value, int bucketIndex) { // 獲取bucketIndex處的Entry Entry<K,V> e = table[bucketIndex]; // 將新創建的Entry放入bucketIndex索引處，并讓新的Entry指向原來的Entry e table[bucketIndex] = new Entry<>(hash, key, value, e); size++; }

上一篇：jdk1.8.0_45源碼解讀——ArrayList的實現

下一篇：【Mrpc】 Demo1 對象與byte[]的相互轉換