中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Java虛擬機中GC算法和種類是什么

發布時間:2021-12-27 13:44:16 來源:億速云 閱讀:156 作者:小新 欄目:編程語言

這篇文章主要介紹了Java虛擬機中GC算法和種類是什么,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

一、GC的概念:

  • GC:Garbage Collection 垃圾收集

  • 1960年 Lisp使用了GC

  • Java中,GC的對象是Java堆和方法區(即***區)

我們接下來對上面的三句話進行一一的解釋:

(1)GC:Garbage Collection 垃圾收集。這里所謂的垃圾指的是在系統運行過程當中所產生的一些無用的對象,這些對象占據著一定的內存空間,如果長期不被釋放,可能導致OOM

在C/C++里是由程序猿自己去申請、管理和釋放內存空間,因此沒有GC的概念。而在Java中,后臺專門有一個專門用于垃圾回收的線程來進行監控、掃描,自動將一些無用的內存進行釋放,這就是垃圾收集的一個基本思想,目的在于防止由程序猿引入的人為的內存泄露。

(2)事實上,GC的歷史比Java久遠,1960年誕生于MIT的Lisp是***門真正使用內存動態分配和垃圾收集技術的語言。當Lisp還在胚胎時期時,人們就在思考GC需要完成的3件事情:

哪些內存需要回收?

什么時候回收?

如何回收?

(3)內存區域中的程序計數器、虛擬機棧、本地方法棧這3個區域隨著線程而生,線程而滅;棧中的棧幀隨著方法的進入和退出而有條不紊地執行著出棧和入棧的操作,每個棧幀中分配多少內存基本是在類結構確定下來時就已知的。在這幾個區域不需要過多考慮回收的問題,因為方法結束或者線程結束時,內存自然就跟著回收了

Java堆和方法區則不同,一個接口中的多個實現類需要的內存可能不同,一個方法中的多個分支需要的內存也可能不一樣,我們只有在程序處于運行期間時才能知道會創建哪些對象,這部分內存的分配和回收都是動態的,GC關注的也是這部分內存,后面的文章中如果涉及到“內存”分配與回收也僅指著一部分內存。

二、引用計數算法:(老牌垃圾回收算法。無法處理循環引用,沒有被Java采納)

1、引用計數算法的概念:

給對象中添加一個引用計數器,每當有一個地方引用它時,計數器值就加1;當引用失效時,計數器值就減1;任何時刻計數器為0的對象就是不可能再被使用的。

Java虛擬機中GC算法和種類是什么

2、使用者舉例:

引用計數算法的實現簡單,判定效率也高,大部分情況下是一個不錯的算法。很多地方應用到它。例如:

微軟公司的COM技術:Computer Object Model

使用ActionScript3的FlashPlayer

Python

但是,主流的java虛擬機并沒有選用引用計數算法來管理內存,其中最主要的原因是:它很難解決對象之間相互循環引用的問題

3、引用計數算法的問題:

  • 引用和去引用伴隨加法和減法,影響性能

  • 致命的缺陷:對于循環引用的對象無法進行回收

Java虛擬機中GC算法和種類是什么

上面的3個圖中,對于最右邊的那張圖而言:循環引用的計數器都不為0,但是他們對于根對象都已經不可達了,但是無法釋放。

循環引用的代碼舉例:

public class Object {      Object field = null;          public static void main(String[] args) {         Thread thread = new Thread(new Runnable() {             public void run() {                 Object objectA = new Object();                 Object objectB = new Object();//位置1                 objectA.field = objectB;                 objectB.field = objectA;//位置2                 //to do something                 objectA = null;                 objectB = null;//位置3             }         });         thread.start();         while (true);     }      }

上方代碼看起來有點刻意為之,但其實在實際編程過程當中,是經常出現的,比如兩個一對一關系的數據庫對象,各自保持著對方的引用。***一個***循環只是為了保持JVM不退出,沒什么實際意義。

代碼解釋:

代碼中標注了1、2、3三個數字,當位置1的語句執行完以后,兩個對象的引用計數全部為1。當位置2的語句執行完以后,兩個對象的引用計數就全部變 成了2。當位置3的語句執行完以后,也就是將二者全部歸為空值以后,二者的引用計數仍然為1。根據引用計數算法的回收規則,引用計數沒有歸0的時候是不會 被回收的。

對于我們現在使用的GC來說,當thread線程運行結束后,會將objectA和objectB全部作為待回收的對象。而如果我們的GC采用上面所說的引用計數算法,則這兩個對象永遠不會被回收,即便我們在使用后顯示的將對象歸為空值也毫無作用。

三、根搜索算法:

1、根搜索算法的概念:

由于引用計數算法的缺陷,所以JVM一般會采用一種新的算法,叫做根搜索算法。它的處理方式就是,設立若干種根對象,當任何一個根對象到某一個對象均不可達時,則認為這個對象是可以被回收的

Java虛擬機中GC算法和種類是什么

如上圖所示,ObjectD和ObjectE是互相關聯的,但是由于GC roots到這兩個對象不可達,所以最終D和E還是會被當做GC的對象,上圖若是采用引用計數法,則A-E五個對象都不會被回收。

2、可達性分析:

我們剛剛提到,設立若干種根對象,當任何一個根對象到某一個對象均不可達時,則認為這個對象是可以被回收的。我們在后面介紹標記-清理算法/標記整理算法時,也會一直強調從根節點開始,對所有可達對象做一次標記,那什么叫做可達呢?這里解釋如下:

可達性分析:

從根(GC Roots)的對象作為起始點,開始向下搜索,搜索所走過的路徑稱為“引用鏈”,當一個對象到GC Roots沒有任何引用鏈相連(用圖論的概念來講,就是從GC Roots到這個對象不可達)時,則證明此對象是不可用的。

3、根(GC Roots):

說到GC roots(GC根),在JAVA語言中,可以當做GC roots的對象有以下幾種:

1、棧(棧幀中的本地變量表)中引用的對象。

2、方法區中的靜態成員。

3、方法區中的常量引用的對象(全局變量)

4、本地方法棧中JNI(一般說的Native方法)引用的對象。

注:***和第四種都是指的方法的本地變量表,第二種表達的意思比較清晰,第三種主要指的是聲明為final的常量值。

在根搜索算法的基礎上,現代虛擬機的實現當中,垃圾搜集的算法主要有三種,分別是標記-清除算法、復制算法、標記-整理算法。這三種算法都擴充了根搜索算法,不過它們理解起來還是非常好理解的。

四、標記-清除算法:

1、標記清除算法的概念:

標記-清除算法是現代垃圾回收算法的思想基礎。標記-清除算法將垃圾回收分為兩個階段:標記階段和清除階段。一種可行的實現是,在標記階段,首先通過根節點,標記所有從根節點開始的可達對象。因此,未被標記的對象就是未被引用的垃圾對象;然后,在清除階段,清除所有未被標記的對象。

Java虛擬機中GC算法和種類是什么

2、標記-清除算法詳解:

它的做法是當堆中的有效內存空間(available memory)被耗盡的時候,就會停止整個程序(也被成為stop the world),然后進行兩項工作,***項則是標記,第二項則是清除。

  • 標記:標記的過程其實就是,遍歷所有的GC Roots,然后將所有GC Roots可達的對象標記為存活的對象。

  • 清除:清除的過程將遍歷堆中所有的對象,將沒有標記的對象全部清除掉。

也就是說,就是當程序運行期間,若可以使用的內存被耗盡的時候,GC線程就會被觸發并將程序暫停,隨后將依舊存活的對象標記一遍,最終再將堆中所有沒被標記的對象全部清除掉,接下來便讓程序恢復運行

來看下面這張圖:

Java虛擬機中GC算法和種類是什么

上圖代表的是程序運行期間所有對象的狀態,它們的標志位全部是0(也就是未標記,以下默認0就是未標記,1為已標記),假設這會兒有效內存空間耗盡了,JVM將會停止應用程序的運行并開啟GC線程,然后開始進行標記工作,按照根搜索算法,標記完以后,對象的狀態如下圖:

Java虛擬機中GC算法和種類是什么

上圖中可以看到,按照根搜索算法,所有從root對象可達的對象就被標記為了存活的對象,此時已經完成了***階段標記。接下來,就要執行第二階段清除了,那么清除完以后,剩下的對象以及對象的狀態如下圖所示:

Java虛擬機中GC算法和種類是什么

上圖可以看到,沒有被標記的對象將會回收清除掉,而被標記的對象將會留下,并且會將標記位重新歸0。接下來就不用說了,喚醒停止的程序線程,讓程序繼續運行即可。

疑問:為什么非要停止程序的運行呢?

答:

這個其實也不難理解,假設我們的程序與GC線程是一起運行的,各位試想這樣一種場景。

假設我們剛標記完圖中最右邊的那個對象,暫且記為A,結果此時在程序當中又new了一個新對象B,且A對象可以到達B對象。但是由于此時A對象已經 標記結束,B對象此時的標記位依然是0,因為它錯過了標記階段。因此當接下來輪到清除階段的時候,新對象B將會被苦逼的清除掉。如此一來,不難想象結 果,GC線程將會導致程序無法正常工作。

上面的結果當然令人無法接受,我們剛new了一個對象,結果經過一次GC,忽然變成null了,這還怎么玩?

3、標記-清除算法的缺點:

(1)首先,它的缺點就是效率比較低(遞歸與全堆對象遍歷),導致stop the world的時間比較長,尤其對于交互式的應用程序來說簡直是無法接受。試想一下,如果你玩一個網站,這個網站一個小時就掛五分鐘,你還玩嗎?

(2)第二點主要的缺點,則是這種方式清理出來的空閑內存是不連續的,這點不難理解,我們的死亡對象都是隨即的出現在內存的各個角落的,現在把它們清除之后,內存的布局自然會亂七八糟。而為了應付這一點,JVM就不得不維持一個內存的空閑列表,這又是一種開銷。而且在分配數組對象的時候,尋找連續的內存空間會不太好找。

五、復制算法:(新生代的GC)

復制算法的概念:

將原有的內存空間分為兩塊,每次只使用其中一塊,在垃圾回收時,將正在使用的內存中的存活對象復制到未使用的內存塊中,之后,清除正在使用的內存塊中的所有對象,交換兩個內存的角色,完成垃圾回收。

  • 與標記-清除算法相比,復制算法是一種相對高效的回收方法

  • 不適用于存活對象較多的場合,如老年代(復制算法適合做新生代的GC

Java虛擬機中GC算法和種類是什么

  • 復制算法的***的問題是:空間的浪費

復制算法使得每次都只對整個半區進行內存回收,內存分配時也就不用考慮內存碎片等復雜情況,只要移動堆頂指針,按順序分配內存即可,實現簡單,運行高效。只是這種算法的代價是將內存縮小為原來的一半,這個太要命了。

所以從以上描述不難看出,復制算法要想使用,最起碼對象的存活率要非常低才行,而且最重要的是,我們必須要克服50%內存的浪費。

現在的商業虛擬機都采用這種收集算法來回收新生代,新生代中的對象98%都是“朝生夕死”的,所以并不需要按照1:1的比例來劃分內存空間,而是將內存分為一塊比較大的Eden空間和兩塊較小的Survivor空間,每次使用Eden和其中一塊Survivor。當回收時,將Eden和Survivor中還存活著的對象一次性地復制到另外一塊Survivor空間上,***清理掉Eden和剛才用過的Survivor空間。HotSpot虛擬機默認Eden和Survivor的大小比例是8:1,也就是說,每次新生代中可用內存空間為整個新生代容量的90%(80%+10%),只有10%的空間會被浪費。

當然,98%的對象可回收只是一般場景下的數據,我們沒有辦法保證每次回收都只有不多于10%的對象存活,當Survivor空間不夠用時,需要依賴于老年代進行分配擔保,所以大對象直接進入老年代。整個過程如下圖所示:

Java虛擬機中GC算法和種類是什么

上圖中,綠色箭頭的位置代表的是大對象,大對象直接進入老年代。

根據上面的復制算法,現在我們來看下面的這個gc日志的數字,就應該能看得懂了吧:

Java虛擬機中GC算法和種類是什么

上方GC日志中,新生代的可用空間是13824K(eden區的12288K+from space的1536K)。而根據內存的地址計算得知,新生代的總空間為15M,而這個15M的空間是 = 13824K +to space 的 1536K。

六、標記-整理算法:(老年代的GC)

引入:

如果在對象存活率較高時就要進行較多的復制操作,效率將會變低。更關鍵的是,如果不想浪費50%的空間,就需要有額外的空間進行分配擔保,以應對被使用的內存中所有對象都100%存活的極端情況,所以在老年代一般不能直接選中這種算法。

概念:

標記-壓縮算法適合用于存活對象較多的場合,如老年代。它在標記-清除算法的基礎上做了一些優化。和標記-清除算法一樣,標記-壓縮算法也首先需要從根節點開始,對所有可達對象做一次標記;但之后,它并不簡單的清理未標記的對象,而是將所有的存活對象壓縮到內存的一端;之后,清理邊界外所有的空間。

Java虛擬機中GC算法和種類是什么

  • 標記:它的***個階段與標記/清除算法是一模一樣的,均是遍歷GC Roots,然后將存活的對象標記。

  • 整理:移動所有存活的對象,且按照內存地址次序依次排列,然后將末端內存地址以后的內存全部回收。因此,第二階段才稱為整理階段。

上圖中可以看到,標記的存活對象將會被整理,按照內存地址依次排列,而未被標記的內存會被清理掉。如此一來,當我們需要給新對象分配內存時,JVM只需要持有一個內存的起始地址即可,這比維護一個空閑列表顯然少了許多開銷。

標記/整理算法不僅可以彌補標記/清除算法當中,內存區域分散的缺點,也消除了復制算法當中,內存減半的高額代價。

  • 但是,標記/整理算法唯一的缺點就是效率也不高。

不僅要標記所有存活對象,還要整理所有存活對象的引用地址。從效率上來說,標記/整理算法要低于復制算法。

標記-清除算法、復制算法、標記整理算法的總結:

三個算法都基于根搜索算法去判斷一個對象是否應該被回收,而支撐根搜索算法可以正常工作的理論依據,就是語法中變量作用域的相關內容。因此,要想防止內存泄露,最根本的辦法就是掌握好變量作用域,而不應該使用C/C++式內存管理方式。

在GC線程開啟時,或者說GC過程開始時,它們都要暫停應用程序(stop the world)。

它們的區別如下:(>表示前者要優于后者,=表示兩者效果一樣)

(1)效率復制算法>標記/整理算法>標記/清除算法(此處的效率只是簡單的對比時間復雜度,實際情況不一定如此)。

(2)內存整齊度:復制算法=標記/整理算法>標記/清除算法。

(3)內存利用率:標記/整理算法=標記/清除算法>復制算法。

注1:可以看到標記/清除算法是比較落后的算法了,但是后兩種算法卻是在此基礎上建立的。

注2:時間與空間不可兼得。

七、分代收集算法:(新生代的GC+老年代的GC)

當前商業虛擬機的GC都是采用的“分代收集算法”,這并不是什么新的思想,只是根據對象的存活周期的不同將內存劃分為幾塊兒。一般是把Java堆分為新生代和老年代:短命對象歸為新生代,長命對象歸為老年代

  • 少量對象存活,適合復制算法:在新生代中,每次GC時都發現有大批對象死去,只有少量存活,那就選用復制算法,只需要付出少量存活對象的復制成本就可以完成GC。

  • 大量對象存活,適合用標記-清理/標記-整理:在老年代中,因為對象存活率高、沒有額外空間對他進行分配擔保,就必須使用“標記-清理”/“標記-整理”算法進行GC。

注:老年代的對象中,有一小部分是因為在新生代回收時,老年代做擔保,進來的對象;絕大部分對象是因為很多次GC都沒有被回收掉而進入老年代

八、可觸及性:

所有的算法,需要能夠識別一個垃圾對象,因此需要給出一個可觸及性的定義。

可觸及的:

從根節點可以觸及到這個對象。

其實就是從根節點掃描,只要這個對象在引用鏈中,那就是可觸及的。

可復活的:

一旦所有引用被釋放,就是可復活狀態

因為在finalize()中可能復活該對象

不可觸及的:

在finalize()后,可能會進入不可觸及狀態

不可觸及的對象不可能復活

要被回收。

finalize方法復活對象的代碼舉例:

package test03;  /**  * Created by smyhvae on 2015/8/19.  */ public class CanReliveObj {     public static CanReliveObj obj;      //當執行GC時,會執行finalize方法,并且只會執行一次     @Override     protected void finalize() throws Throwable {         super.finalize();         System.out.println("CanReliveObj finalize called");         obj = this;   //當執行GC時,會執行finalize方法,然后這一行代碼的作用是將null的object復活一下,然后變成了可觸及性     }      @Override     public String toString() {         return "I am CanReliveObj";     }      public static void main(String[] args) throws             InterruptedException {         obj = new CanReliveObj();         obj = null;   //可復活         System.out.println("***次gc");         System.gc();         Thread.sleep(1000);         if (obj == null) {             System.out.println("obj 是 null");         } else {             System.out.println("obj 可用");         }         obj = null;    //不可復活         System.out.println("第二次gc");         System.gc();         Thread.sleep(1000);         if (obj == null) {             System.out.println("obj 是 null");         } else {             System.out.println("obj 可用");         }     } }

我們需要注意第14行的注釋。一開始,我們在第25行將obj設置為null, 然后執行一次GC,本以為obj會被回收掉,其實并沒有,因為GC的時候會調用11行的finalize方法,然后obj在第14行被復活了。緊接著又在 第34行設置obj設置為null,然后執行一次GC,此時obj就被回收掉了,因為finalize方法只會執行一次。

Java虛擬機中GC算法和種類是什么

finalize方法的使用總結:

  • 經驗:避免使用finalize(),操作不慎可能導致錯誤。

  • 優先級低,何時被調用,不確定

何時發生GC不確定,自然也就不知道finalize方法什么時候執行

  • 如果要使用finalize去釋放資源,我們可以使用try-catch-finally來替代它

九、Stop-The-World:

1、Stop-The-World概念:

Java中一種全局暫停的現象。

全局停頓,所有Java代碼停止,native代碼可以執行,但不能和JVM交互

多半情況下是由于GC引起

少數情況下由其他情況下引起,如:Dump線程、死鎖檢查、堆Dump。

2、GC時為什么會有全局停頓?

打個比方:類比在聚會,突然GC要過來打掃房間,聚會時很亂,又有新的垃圾產生,房間永遠打掃不干凈,只有讓大家停止活動了,才能將房間打掃干凈。

況且,如果沒有全局停頓,會給GC線程造成很大的負擔,GC算法的難度也會增加,GC很難去判斷哪些是垃圾。

3、Stop-The-World的危害:

長時間服務停止,沒有響應

遇到HA系統,可能引起主備切換,嚴重危害生產環境。

備注:HA:High Available, 高可用性集群。

Java虛擬機中GC算法和種類是什么

比如上面的這主機和備機:現在是主機在工作,此時如果主機正在GC造成長時間停頓,那么備機就會監測到主機沒有工作,于是備機開始工作了;但是主機不工作只是暫時的,當GC結束之后,主機又開始工作了,那么這樣的話,主機和備機就同時工作了。主機和備機同時工作其實是非常危險的,很有可能會導致應用程序不一致、不能提供正常的服務等,進而影響生產環境。

代碼舉例:

(1)打印日志的代碼:(每隔100ms打印一條)

  1. public static class PrintThread extends Thread{ 

  2.     public static final long starttime=System.currentTimeMillis(); 

  3.     @Override 

  4.     public void run(){ 

  5.         try{ 

  6.             while(true){ 

  7.                 long t=System.currentTimeMillis()-starttime; 

  8.                 System.out.println("time:"+t); 

  9.                 Thread.sleep(100); 

  10.             } 

  11.         }catch(Exception e){ 

  12.  

  13.         } 

  14.     } 

  15. }

上方代碼中,是負責打印日志的代碼,每隔100ms打印一條,并計算打印的時間。

(2)工作線程的代碼:(工作線程,專門用來消耗內存)

public static class MyThread extends Thread{     HashMap<Long,byte[]> map=new HashMap<Long,byte[]>();     @Override     public void run(){         try{             while(true){                 if(map.size()*512/1024/1024>=450){   //如果map消耗的內存消耗大于450時,那就清理內存                     System.out.println("=====準備清理=====:"+map.size());                     map.clear();                 }                  for(int i=0;i<1024;i++){                     map.put(System.nanoTime(), new byte[512]);                 }                 Thread.sleep(1);             }         }catch(Exception e){             e.printStackTrace();         }     } }

然后,我們設置gc的參數為:

-Xmx512M -Xms512M -XX:+UseSerialGC -Xloggc:gc.log -XX:+PrintGCDetails -Xmn1m -XX:PretenureSizeThreshold=50 -XX:MaxTenuringThreshold=1

打印日志如下:

Java虛擬機中GC算法和種類是什么

上圖中,紅色字體代表的正在GC。按道理來說,應該是每隔100ms會打印輸出一條日志,但是當執行GC的時候,會出現群居停頓的情況,導致沒有按時輸出。

感謝你能夠認真閱讀完這篇文章,希望小編分享的“Java虛擬機中GC算法和種類是什么”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

宝坻区| 老河口市| 黄山市| 望奎县| 井研县| 文化| 五家渠市| 海口市| 于都县| 临洮县| 平邑县| 柞水县| 鞍山市| 荔波县| 都安| 云霄县| 犍为县| 江城| 喀喇沁旗| 沙洋县| 海晏县| 黄骅市| 马鞍山市| 武穴市| 闸北区| 仪征市| 临邑县| 松溪县| 垣曲县| 岫岩| 武功县| 华宁县| 高淳县| 介休市| 峨眉山市| 铜鼓县| 新疆| 西乌| 邹城市| 凤阳县| 凤山县|