您好,登錄后才能下訂單哦!
這篇文章主要詳解JAVA中HashMap的面試題,內容清晰明了,對此有興趣的小伙伴可以學習一下,相信大家閱讀完之后會有幫助。
1. 為什么我們建議在定義HashMap的時候,就指定它的初始化大小呢?
答:在當我們對HashMap初始化時,如果沒有為其設置初始化容量,那么系統會默認創建一個容量為16的大小的集合。當我們向HashMap中添加元素時,如果HashMap的容量值超過了它的臨界值(默認16*0.75=12)時,(0.75是HashMap的加載因子)HashMap將會重新擴容到下一個2的指數次冪(2^4=16 下一個2的指數次冪是2^5=32)。由于HashMap擴容要進行resize的操作,頻繁的resize,會導致HashMap的性能下降,所以建議在確定HashMap集合的大小的情況下,指定其初始化大小,避免做過多的resize操作,導致性能下降。
2. HashMap什么時候進行擴容?
答:當我們不斷的向HashMap中添加元素時,它會判斷HashMap當前的容量值(當前元素的個數)是否超過了它的臨界值(在沒有指定其初始化大小時,默認16*0.75=12),如果添加的元素個數超過了臨界值,它就會開始進行擴容。
3. HashMap在擴容時,擴容到多大?
答:HashMap在擴容時,它會擴容到下一個2的指數次冪,即當前容量的2倍,比如當前容量是2^4=16,將會擴容到下一個2的指數次冪2^5=32.
4. HashMap是如何進行擴容的?
答:HashMap進行擴容時會調用resize()函數,重新計算HashMap所需的新的容量,然后重新定義一個新的容器,將原數組數據進行Hash, 放入新的容器中。這個過程將會導致HashMap的性能下降。
resize()函數的源碼:
//HashMap 擴容操作 final Node<K,V>[] resize() { //保存當前table Node<K,V>[] oldTab = table; //保存當前table的容量 int oldCap = (oldTab == null) ? 0 : oldTab.length; //保存當前閾值 int oldThr = threshold; //初始化新的table容量和閾值 int newCap, newThr = 0; //1. resize()函數在size(HashMap當前的元素個數) > threshold(當前閾值,默認16*0.75=12)時調用。 //當oldCap(HashMap的元素個數)大于0表示原來的table表非空,oldCap(threshold)為oldCap x load_factor(加載因子:0.75) if (oldCap > 0) { //若舊table容量大于等于最大容量,更新閾值為Integer.MAX_VALUE(最大整形值),這樣以后就不會自動擴容了 if (oldCap >= MAXIMUM_CAPACITY) { threshold = Integer.MAX_VALUE; return oldTab; } //擴容到下一個2的指數次冪,容量翻倍,使用左移,效率更高 else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY) newThr = oldThr << 1; // double threshold //閾值翻倍 } //2. resize()函數在table為空被調用。oldCap小于等于0且oldThr大于0,表示用戶使用HashMap的構造函數創建了一個HashMap, //使用的構造函數為HashMap(int initialCapacity, float loadFactor)或HashMap(int initialCapacity)或HashMap(Map<? extends K, ? extends V> m), //導致了oldTab為null,oldCap為0,oldThr為用戶指定的HashMap的初始化容量 else if (oldThr > 0) // initial capacity was placed in threshold newCap = oldThr; //當table沒有初始化時,threshold為初始容量, threshold = tableSizeFor(t); //3. resize()函數在table為空被調用。oldCap小于等于0且oldThr大于0,表示用戶使用HashMap的無參構造函數HashMap()函數創建了一個HashMap, //此時,所有值均采用默認值,oldTab(table)表為空,oldCap為0,oldThr等于0. else { // zero initial threshold signifies using defaults newCap = DEFAULT_INITIAL_CAPACITY; newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY); } //如果新的閾值為0 if (newThr == 0) { float ft = (float)newCap * loadFactor; //新的tbale容量*加載因子 newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ? (int)ft : Integer.MAX_VALUE); } threshold = newThr; @SuppressWarnings({"rawtypes","unchecked"}) //初始化table Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap]; table = newTab; if (oldTab != null) { //把oldTab中的節點reHash到newTab中去 for (int j = 0; j < oldCap; ++j) { Node<K,V> e; if ((e = oldTab[j]) != null) { oldTab[j] = null; //如果節點是單個節點,直接在newTab中進行重定位 if (e.next == null) newTab[e.hash & (newCap - 1)] = e; //如果節點是TreeNode節點,要進行紅黑樹的rehash操作 else if (e instanceof TreeNode) ((TreeNode<K,V>)e).split(this, newTab, j, oldCap); //如果是鏈表,進行鏈表的rehash操作 else { // preserve order Node<K,V> loHead = null, loTail = null; Node<K,V> hiHead = null, hiTail = null; Node<K,V> next; //將同一桶中的元素根據(e.hash & oldCap)是否為0進行分割,分成兩個不同的鏈表,完成rehash操作 do { next = e.next; //根據算法 e.hash & oldCap 判斷節點位置rehash后是否發生改變,最高位==0,這是索引不變的鏈表 if ((e.hash & oldCap) == 0) { if (loTail == null) loHead = e; else loTail.next = e; loTail = e; } //最高位==1,這是索引發生改變的鏈表 else { if (hiTail == null) hiHead = e; else hiTail.next = e; hiTail = e; } } while ((e = next) != null); if (loTail != null) { //原bucket位置的尾指針不為空(即還有node) loTail.next = null; //鏈表最后一個節點為null newTab[j] = loHead; //鏈表的頭指針放在新桶的相同下標(j)處 } if (hiTail != null) { hiTail.next = null; newTab[j + oldCap] = hiHead; //rehash后節點新的位置一定為原來基礎上加上oldCap } } } } } return newTab; }
5. 為什么說HashMap是線程不安全的?
答:HashMap在多線程并發時線程不安全,主要表現在下面兩個方面:
(1) 當向HashMap中put(添加)元素時導致的多線程數據不一致
比如有兩個線程 A 和 B ,首先 A 希望插入一個 key-value鍵值對到HashMap 中,它首先計算記錄所要落到的 hash 桶的索引坐標,然后獲取到該桶里面的鏈表頭結點,此時線程 A 的時間片用完了,而此時線程 B 被調度得以執行,和線程 A 一樣執行,只不過線程 B 成功將記錄插到了桶里面。假設線程 A 插入的記錄計算出來的 hash 桶索引和線程 B 要插入的記錄計算出來的 hash 桶索引是一樣的,那么當線程 B 成功插入之后,線程 A 再次被調度運行時,它依然持有過期的鏈表頭但是它對此一無所知,以至于它認為它應該這樣做,如此一來就覆蓋了線程 B 插入的記錄,這樣線程 B 插入的記錄就憑空消失了,造成了數據不一致的行為。
簡單來說就是在多線程環境下,向HashMap集合中添加元素會存在覆蓋的現象,導致了線程不安全。
(2) 當HashMap進行擴容調用resize()函數時引起死循環
HashMap在put的時候,插入的元素超過了容量(由負載因子決定)的范圍就會觸發擴容操作,就是rehash,這個會重新將原數組的內容重新hash到新的擴容數組中,在多線程的環境下,存在同時其他的元素也在進行put操作,如果hash值相同,可能出現同時在同一數組下用鏈表表示,造成閉環,導致在get時會出現死循環,所以HashMap是線程不安全的。
HashMap
的線程不安全主要體現在下面兩個方面:
1.在JDK1.7中,當并發執行擴容操作時會造成環形鏈和數據丟失的情況。
2.在JDK1.8中,在并發執行put操作時會發生數據覆蓋的情況。
6. 說說HashMap 的數據結構
HashMap是一個key-value鍵值對的數據結構,從結構上來講在jdk1.8之前是用數組加鏈表的方式實現,jdk1.8加了紅黑樹,HashMap數組的默認初始長度是16,HashMap數組只允許一個key為null,允許多個value為null
HashMap的內部實現,HashMap是使用數組+鏈表+紅黑樹的形式實現的,其中數組是一個一個Node[]數組,我們叫他hash桶數組,它上面存放的是key-value鍵值對的節點。HashMap是用hash表來存儲的,在HashMap里為解決hash沖突,使用鏈地址法,簡單來說就是數組加鏈表的形式來解決,當數據被hash后,得到數組下標,把數據放在對應下標的鏈表中。
HashMap是基于哈希表的Map接口的非同步實現。此實現提供所有可選的映射操作,并允許使用null值和null鍵。此類不保證映射的順序,特別是它不保證該順序恒久不變。HashMap實際上是一個“鏈表散列”的數據結構,即數組和鏈表的結合體。HashMap底層就是一個數組結構,數組中的每一項又是一個鏈表。當新建一個HashMap的時候,就會初始化一個數組。HashMap主干為一個Entry數組,而每個Entry存放著一個鍵值對和同時指向另一個Entry的引用,如果發生哈希沖突,該引用即指向另一個Entry。
HashMap是由數組+鏈表結構組成,數組是HashMap主體,鏈表則是為了解決哈希沖突而存在,如果對于Entry不含鏈表的位置,對其操作的時間復雜度為O(1),如果定位到具有鏈表的位置,則時間復雜度為O(n)。
HashMap中重要字段:
transient int size :實際儲存的KEY-VALUE對個數
int threshold :閥值,當表為空的時候,該值初始容量為16,后期擴容使用
final float loadFactor :負載因子,代表表的填充度,默認為0.75
transient int modCount : 用于快速失敗,迭代時拋出異常
在JDK1.8中 HashMap底層改為鏈表+數組+紅黑樹的形式,當Hash沖突多次在同一個位置發生的時候,(確切的說是該位置鏈表長度大于8時),在此位置將用紅黑樹來儲存數據提高讀取效率.
HashMap 包含如下幾個構造器:
HashMap():構建一個初始容量為 16,負載因子為 0.75 的 HashMap。
HashMap(int initialCapacity):構建一個初始容量為 initialCapacity,負載因子為 0.75 的 HashMap。
HashMap(int initialCapacity, float loadFactor):以指定初始容量、指定的負載因子創建一個 HashMap。
HashMap的基礎構造器HashMap(int initialCapacity, float loadFactor)帶有兩個參數,它們是初始容量initialCapacity和負載因子loadFactor。
負載因子loadFactor衡量的是一個散列表的空間的使用程度,負載因子越大表示散列表的裝填程度越高,反之愈小。對于使用鏈表法的散列表來說,查找一個元素的平均時間是O(1+a),因此如果負載因子越大,對空間的利用更充分,然而后果是查找效率的降低;如果負載因子太小,那么散列表的數據將過于稀疏,對空間造成嚴重浪費。
HashMap的實現中,通過threshold字段來判斷HashMap的最大容量:
threshold = (int)(capacity * loadFactor);
結合負載因子的定義公式可知,threshold就是在此loadFactor和capacity對應下允許的最大元素數目,超過這個數目就重新resize,以降低實際的負載因子。默認的負載因子0.75是對空間和時間效率的一個平衡選擇。當容量超出此最大容量時, resize后的HashMap容量是容量的兩倍:
7. HashMap 的工作原理是什么?
一,存儲方式: Java中的HashMap是以鍵值對(key-value)的形式存儲元素的。
二,調用原理: HashMap需要一個hash函數,它使用hashCode()和equals()方法來向集合/從集合添加和檢索元素。當調用put()方法的時候,HashMap會計算key的hash值,然后把鍵值對存儲在集合中合適的索引上。如果key已經存在了,value會被更新成新值。
HashMap的實現原理:
1. 利用key的hashCode重新hash計算出當前對象的元素在數組中的下標
2. 存儲時,如果出現hash值相同的key,此時有兩種情況。(1)如果key相同,則覆蓋原始值;(2)如果key不同(出現沖突),則將當前的key-value放入鏈表中
3. 獲取時,直接找到hash值對應的下標,在進一步判斷key是否相同,從而找到對應值。
4. 理解了以上過程就不難明白HashMap是如何解決hash沖突的問題,核心就是使用了數組的存儲方式,然后將沖突的key的對象放入鏈表中,一旦發現沖突就在鏈表中做進一步的對比。
看完上述內容,是不是對詳解JAVA中HashMap的面試題有進一步的了解,如果還想學習更多內容,歡迎關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。