您好,登錄后才能下訂單哦!
了解 JVM 是對 Java 開發人員的基本要求,JVM 的相關內容自然也成了現在 Java 程序員面試的重要考點。不過估計很多小伙伴和我一樣,長時間醉心于 CRUD,卻忘了去了解一下更底層、更基礎的東西,殊不知這些才是決定你能在這條路上走多遠的關鍵因素,那接下來我們就一起來深入學習一下看似神秘的 JVM 吧。JVM 總體來看內容還是很多的,我會把最重要的內容介紹給大家,不過如果你有時間和精力的話,還是推薦你去看一下《深入理解Java虛擬機》這本書,確實是有口皆碑。本文也會引用很多此書的內容并加上我自己的理解,如果你堅持看下去的話,相信會有很大的收獲。
首先對 JVM 做個簡單的介紹,JVM 是 JDK 的一部分,《Java 虛擬機規范》(The Java Virtual Machine Specification) 是平行于《Java 語言規范》(The Java Language Specification)的一套獨立的規范,不同的公司對其有不同的實現 (類似于一個接口被不同的類實現),比較著名的 Java 虛擬機實現版本有 HotSpot、JRockit 和 J9 等。
本文分為兩大部分,將分別為大家介紹 JVM 的整體架構和運行時數據區,這兩部分的依據均是《Java 虛擬機規范》,而不針對任何特定的 JVM 具體實現版本。
在我看來,不管學習什么樣的知識或技術,首先要做的就是從全局上去認識它,這樣才能避免盲人摸象,事倍功半的情況發生。既然要學習 JVM,就要先了解它的整體架構,于是我畫了個 JVM 架構圖來幫助大家認識它。
Java 虛擬機架構圖
對 JVM 還不太了解的同學第一次看到這張花里胡哨的圖肯定會一臉懵逼,不用怕,其實我們只需要重點理解并掌握其中一部分 (同時也是面試重點) 就好了,比如運行時數據區、垃圾收集器、內存分配策略和類加載機制等,類文件結構也可以學習一下,其他的稍作了解即可。既然本篇文章是要帶領大家認識 JVM 架構的,那就先把圖中各個部分都介紹一下吧 (注:本文只做介紹,讓各位先對 JVM 有個整體的認識,后續會做深入探討)。
Java 之所以號稱“一次編寫,處處運行”,就是得益于虛擬機和 Class 文件 (注:CLass 文件、字節碼文件和類文件是一個意思) 的組合機制。程序員并不需要自己去適配不同的操作系統,大家都知道我們平時編寫的 java 代碼在編譯成 Class 文件后才能執行,而 Class 文件可以在任何操作系統上的 JVM 上執行,這樣就做到了“平臺無關性”。下面是一個最簡單的 HelloWorld 程序及其對應的 Class 文件。
HelloWorld 程序及其編譯后的 Class 文件
得益于 Class 文件,JVM 還可以做到“語言無關性”,也就是說不只有 Java 程序可以運行于 JVM 之上,很多其他語言例如最近在安卓開發者中大火的 Kotlin 語言,還有 Scala、Groovy 等語言也都是基于 JVM 平臺的,這些語言的代碼都可以編譯成 Class 文件,然后在 JVM 上運行。
JVM提供的平臺無關性和語言無關性
要執行 Class 文件就需要先將其加載進內存,這一工作正是由類加載器 (ClassLoader) 完成的,系統為我們提供了三種類加載器,分別是啟動類加載器 (Bootstrap ClassLoader)、擴展類加載器 (Extension ClassLoader) 和應用程序類加載器 (Application ClassLoader),如果有必要,我們也可以加入自定義的類加載器。類加載過程如下:
類加載過程
類加載過程分為加載、連接和初始化三個階段,其中的連接階段又分為驗證、準備和解析三個階段 (詳細的類加載機制在后續文章中進行介紹)。
這部分內容較多,放在本文第二部分單獨進行介紹。
字節碼被加載進運行時數據區后,執行引擎會進行讀取并執行,執行引擎主要包含以下模塊:
如果你經常看 JDK 源碼的話,一定會注意到 native 這個關鍵詞,被它修飾的方法是沒有方法體的,是因為它調用了計算機本地的方法庫 (通常是 C 或 C++ 代碼)。JDK 源碼中有很多類的方法,特別是一些需要操作計算機硬件的方法,都調用了本地方法庫,畢竟與硬件打交道還是用 C 和 C++ 更方便,比如下面這些方法:
// 例一:這是 Thread 類中的 currentThread 方法,用于獲取當前正在執行的線程
public static native Thread currentThread();
// 例二:這是 FileInputStream 類中 open0 方法,用于打開指定文件
private native void open0(String name) throws FileNotFoundException;
本地庫接口所調用的對象正是位于這個庫中,一般是位于計算機本地的 C 或 C++ 語言代碼。
Java 虛擬機運行時數據區是我們需要重點了解并熟悉的部分,因為這與我們寫的程序息息相關,平時常見的 StackOverflowError 和 OutOfMemoryError 也幾乎都是來自這個區域。說“幾乎”是因為當本機直接內存不夠用時也會拋出 OutOfMemoryError。如下圖所示,程序計數器、Java 虛擬機棧和本地方法棧是線程私有的,堆和方法區是線程共享的,其中方法區又包含了運行時常量池。下面就對這個部分做個詳細的介紹吧 (注:本部分引用內容來自《深入理解Java虛擬機》)。
Java 虛擬機運行時數據區
怕有些小伙伴不清楚,提示一下:下面這樣的段落格式就是 Markdown 里的引用格式,,一般用于引用他人的文章或別處的內容。
程序計數器(Program Counter Register)是一塊較小的內存空間,它可以看作是當前線程所執行的字節碼的行號指示器。在Java虛擬機的概念里,字節碼解釋器工作時就是通過改變這個計數器 的值來選取下一條需要執行的字節碼指令,它是程序控制流的指示器,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。
由于Java虛擬機的多線程是通過線程輪流切換、分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對于多核處理器來說是一個內核)都只會執行一條線程中的指令。因此,為了線程切換后能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間計數器互不影響,獨立存儲,我們稱這類內存區域為“線程私有”的內存。
如果線程正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是本地 (Native) 方法,這個計數器值則應為空 (Undefined)。此內存區域是唯一一個在《Java虛擬機規范》中沒有規定任何 OutOfMemoryError 情況的區域。
這里引用了《深入理解Java虛擬機》書中的內容,其實不難理解,程序計數器的作用就是保存線程的執行狀態,引用部分的第三段中說“如果線程正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址”,這個地址就是字節碼執行到的位置。我們平時說的 Java 多線程上下文切換就需要程序計數器的輔助,當 CPU 從一個線程切換到另一個線程時,要從程序計數器中讀取線程執行狀態從而恢復現場。后面又說“如果執行的是本地 (Native)方法,這個計數器值為空(Undefined)”,這是為何呢?是因為本地方法執行的是 C / C++ 代碼,在原生平臺直接運行,也就不存在 Java 虛擬機的概念,自然也無法保存字節碼指令地址,此時要想記錄代碼運行狀態的話,只能使用原生 CPU 的 PC 寄存器。
與程序計數器一樣,Java虛擬機棧(Java Virtual Machine Stack)也是線程私有的,它的生命周期與線程相同。虛擬機棧描述的是 Java 方法執行的線程內存模型:每個方法被執行的時候,Java 虛擬機都 會同步創建一個棧幀(Stack Frame)用于存儲局部變量表、操作數棧、動態連接、方法出口等信息。每一個方法被調用直至執行完畢的過程,就對應著一個棧幀在虛擬機棧中從入棧到出棧的過程。
局部變量表存放了編譯期可知的各種Java虛擬機基本數據類型(boolean、byte、char、short、int、 float、long、double)、對象引用 (reference 類型,它并不等同于對象本身,可能是一個指向對象起始地址的引用指針,也可能是指向一個代表對象的句柄或者其他與此對象相關的位置) 和 returnAddress 類型(指向了一條字節碼指令的地址)。
這些數據類型在局部變量表中的存儲空間以局部變量槽 (Slot) 來表示,其中64位長度的 long 和 double 類型的數據會占用兩個變量槽,其余的數據類型只占用一個。局部變量表所需的內存空間在編譯期間完成分配,當進入一個方法時,這個方法需要在棧幀中分配多大的局部變量空間是完全確定的,在方法運行期間不會改變局部變量表的大小。請讀者注意,這里說的“大小”是指變量槽的數量,虛擬機真正使用多大的內存空間 (譬如按照1個變量槽占用32個比特、64個比特,或者更多)來實現一個變量槽,這是完全由具體的虛擬機實現自行決定的事情。
在《Java虛擬機規范》中,對這個內存區域規定了兩類異常狀況:如果線程請求的棧深度大于虛擬機所允許的深度,將拋出 StackOverflowError 異常;如果 Java 虛擬機棧容量可以動態擴展,當棧擴展時無法申請到足夠的內存會拋出 OutOfMemoryError 異常。
Java 虛擬機棧的內部結構如下圖所示:
Java 虛擬機棧
局部變量表是存放方法參數和局部變量的區域。 局部變量沒有準備階段, 必須顯式初始化。如果是非靜態方法,則在 index[0] 位置上存儲的是方法所屬對象的實例引用,一個引用變量占 4 個字節,隨后存儲的是參數和局部變量。
操作數棧是個初始狀態為空的桶式結構棧。在方法執行過程中, 會有各種指令往棧中寫入和提取信息。JVM 的執行引擎是基于棧的執行引擎,其中的棧指的就是操作數棧。字節碼指令集的定義都是基于棧類型的,棧的深度在方法元信息的 stack 屬性中。下面使用 i++ 和 ++i 的區別來幫助理解操作數棧:
i++ 和 ++i 的區別:
之所以說 i++ 不是原子操作,即使使用 volatile 修飾也不是線程安全,就是因為,可能 i 被從局部變量表(內存)取出,壓入操作棧(寄存器),操作棧中自增,使用棧頂值更新局部變量表(寄存器更新寫入內存),其中分為 3 步,volatile 保證可見性,保證每次從局部變量表讀取的都是最新的值,但可能這 3 步可能被另一個線程的 3 步打斷,產生數據互相覆蓋問題,從而導致 i 的值比預期的小。
每個棧幀中包含一個在常量池中對當前方法的引用, 目的是支持方法調用過程的動態連接。
方法執行時有兩種退出情況:
無論何種退出情況,都將返回至方法當前被調用的位置。方法退出的過程相當于彈出當前棧幀,退出可能有三種方式:
本地方法棧與虛擬機棧所發揮的作用是非常相似的,其區別只是虛擬機棧為虛擬機執行 Java 方法 (也就是字節碼)服務,而本地方法棧則是為虛擬機使用到的本地 (Native) 方法服務。
《Java虛擬機規范》對本地方法棧中方法使用的語言、使用方式與數據結構并沒有任何強制規定,因此具體的虛擬機可以根據需要自由實現它,甚至有的Java虛擬機 (譬如Hot-Spot虛擬機)直接就把本地方法棧和虛擬機棧合二為一。與虛擬機棧一樣,本地方法棧也會在棧深度溢出或者棧擴展失 敗時分別拋出 StackOverflowError 和OutOfMemoryError 異常。
這部分比較好理解,就不做解析了。
對于Java應用程序來說,Java 堆 (Java Heap)是虛擬機所管理的內存中最大的一塊。Java 堆是被所有線程共享的一塊內存區域,在虛擬機啟動時創建。此內存區域的唯一目的就是存放對象實例,Java 世界里“幾乎”所有的對象實例都在這里分配內存。Java 堆是垃圾收集器管理的內存區域,因此也常被稱為“GC 堆”。
根據《Java虛擬機規范》的規定,Java堆可以處于物理上不連續的內存空間中,但在邏輯上它應該被視為連續的,這點就像我們用磁盤空間去存儲文件一樣,并不要求每個文件都連續存放。但對于大 對象(典型的如數組對象),多數虛擬機實現出于實現簡單、存儲高效的考慮,很可能會要求連續的內存空間。
Java 堆既可以被實現成固定大小的,也可以是可擴展的,不過當前主流的Java虛擬機都是按照可擴展來實現的(通過參數-Xmx和-Xms設定)。如果在 Java 堆中沒有內存完成實例分配,并且堆也無法再擴展時,Java 虛擬機將會拋出 OutOfMemoryError 異常。
Java 堆的唯一作用就是存放對象實例,這也是垃圾收集器最關注的內存區域,因為大多數對象實例的存活時間都很短,比如在方法內部創建的實例在方法執行完之后就沒有存在價值了,所以這個區域的垃圾回收性價比最高。關于垃圾回收的詳細內容,見后續文章。
方法區 (Method Area)與 Java 堆一樣,是各個線程共享的內存區域,它用于存儲已被虛擬機加載 的類型信息、常量、靜態變量、即時編譯器編譯后的代碼緩存等數據。雖然《Java虛擬機規范》中把方法區描述為堆的一個邏輯部分,但是它卻有一個別名叫作“非堆”(Non-Heap),目的是與 Java 堆區分開來。
說到方法區,不得不提一下“永久代”這個概念,尤其是在JDK 8以前,許多 Java 程序員都習慣在 HotSpot 虛擬機上開發、部署程序,很多人都更愿意把方法區稱呼為“永久代”(Permanent Generation),或將兩者混為一談。本質上這兩者并不是等價的,因為僅僅是當時的 HotSpot 虛擬機設計團隊選擇把收集器的分代設計擴展至方法區,或者說使用永久代來實現方法區而已,這樣使得 HotSpot的垃圾收集器能夠像管理Java堆一樣管理這部分內存,省去專門為方法區編寫內存管理代碼的工作。但是對于其他虛擬機實現,譬如 BEA JRockit、IBM J9 等來說,是不存在永久代的概念的。原則上如何實現方法區屬于虛擬機實現細節,不受《Java虛擬機規范》管束,并不要求統一。但現在回頭來看,當年使用永久代來實現方法區的決定并不是一個好主意,這種設計導致了 Java 應用更容易遇到 內存溢出的問題(永久代有-XX:M axPermSize 的上限,即使不設置也有默認大小,而 J9 和 JRockit 只要沒有觸碰到進程可用內存的上限,例如32位系統中的4GB限制,就不會出問題 ),而且有極少數方法 (例如 String :: intern() ) 會因永久代的原因而導致不同虛擬機下有不同的表現。當 Oracle 收購 BEA 獲得了 JRockit 的所有權后,準備把 JRockit 中的優秀功能,譬如 Java Mission Control 管理工具,移植到 HotSpot 虛擬機時,但因為兩者對方法區實現的差異而面臨諸多困難。考慮到 HotSpot 未來的發展,在 JDK 6 的 時候 HotSpot 開發團隊就有放棄永久代,逐步改為采用本地內存 (Native Memory) 來實現方法區的計劃了,到了JDK 7 的 HotSpot,已經把原本放在永久代的字符串常量池、靜態變量等移出,而到了 JDK 8,終于完全廢棄了永久代的概念,改用與 JRockit、J9 一樣在本地內存中實現的元空間(Metaspace)來代替,把JDK 7中永久代還剩余的內容(主要是類型信息)全部移到元空間中。
《Java虛擬機規范》對方法區的約束是非常寬松的,除了和 Java 堆一樣不需要連續的內存和可以選擇固定大小或者可擴展外,甚至還可以選擇不實現垃圾收集。相對而言,垃圾收集行為在這個區域的確是比較少出現的,但并非數據進入了方法區就如永久代的名字一樣“永久”存在了。這區域的內存回收目標主要是針對常量池的回收和對類型的卸載,一般來說這個區域的回收效果比較難令人滿意,尤其是類型的卸載,條件相當苛刻,但是這部分區域的回收有時又確實是必要的。
根據《Java虛擬機規范》的規定,如果方法區無法滿足新的內存分配需求時,將拋出 OutOfMemoryError 異常。
這部分引用內容對方法區的介紹十分全面,切記不要將方法區和永久代混為一談,從JDK 8 以后已經沒有永久代的概念了。
運行時常量池 (Runtime Constant Pool) 是方法區的一部分。Class 文件中除了有類的版本、字段、方法、接口等描述信息外,還有一項信息是常量池表 (Constant Pool Table),用于存放編譯期生成的各種字面量與符號引用,這部分內容將在類加載后存放到方法區的運行時常量池中。
既然運行時常量池是方法區的一部分,自然受到方法區內存的限制,當常量池無法再申請到內存 時會拋出OutOfMemoryError異常。
常量池是為了避免頻繁的創建和銷毀對象而影響系統性能,其實現了對象的共享。
本文作為講解 Java 虛擬機的一篇文章,為大家介紹了 Java 虛擬機的整體架構和運行時數據區,相信大家對 JVM 已經有了整體的認識。但這還遠遠不夠,JVM 還有更多而內容和細節等著我們去探索。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。