深入理解JVM虛擬機5：虛擬機字節碼執行引擎

發布時間：2020-08-12 12:03:45 來源：ITPUB博客閱讀：187 作者：Java技術江湖欄目：編程語言

本文轉自： https://www.cnblogs.com/snailclimb/p/9086337.html

本系列文章將整理到我在GitHub上的《Java面試指南》倉庫，更多精彩內容請到我的倉庫里查看

https://github.com/h3pl/Java-Tutorial

喜歡的話麻煩點下Star哈

文章將同步到我的個人博客：

www.how2playlife.com

本文是微信公眾號【Java技術江湖】的《深入理解JVM虛擬機》其中一篇，本文部分內容來源于網絡，為了把本文主題講得清晰透徹，也整合了很多我認為不錯的技術博客內容，引用其中了一些比較好的博客文章，如有侵權，請聯系作者。

該系列博文會告訴你如何從入門到進階，一步步地學習JVM基礎知識，并上手進行JVM調優實戰，JVM是每一個Java工程師必須要學習和理解的知識點，你必須要掌握其實現原理，才能更完整地了解整個Java技術體系，形成自己的知識框架。

為了更好地總結和檢驗你的學習成果，本系列文章也會提供每個知識點對應的面試題以及參考答案。

如果對本系列文章有什么建議，或者是有什么疑問的話，也可以關注公眾號【Java技術江湖】聯系作者，歡迎你參與本系列博文的創作和修訂。

1 概述

執行引擎是java虛擬機最核心的組成部件之一。虛擬機的執行引擎由自己實現，所以可以自行定制指令集與執行引擎的結構體系，并且能夠執行那些不被硬件直接支持的指令集格式。

所有的Java虛擬機的執行引擎都是一致的： 輸入的是字節碼文件，處理過程是字節碼解析的等效過程，輸出的是執行結果。本節將主要從概念模型的角度來講解 虛擬機的方法調用和字節碼執行。

2 運行時棧幀結構

棧幀（Stack Frame） 是用于支持虛擬機方法調用和方法執行的數據結構，它是虛擬機運行時數據區中 虛擬機棧（Virtual Machine Stack）的棧元素。

棧幀存儲了方法的局部變量表、操作數棧、動態連接和方法返回地址等信息。每一個方法從調用開始至執行完成的過程，都對應著一個棧幀在虛擬機棧里面從入棧到出棧的過程。

棧幀概念結構如下圖所示：

深入理解JVM虛擬機5：虛擬機字節碼執行引擎 cdn.xitu.io/2018/5/4/1632919c2fc34c02?w=640&h=569&f=png&s=116882">

2.1 局部變量表

局部變量表是一組變量值存儲空間，用于存放方法參數和方法內定義的局部變量。
局部變量表的容量以變量槽（Variable Slot）為最小單位。一個Slot可以存放一個32位以內（boolean、byte、char、short、int、float、reference和returnAddress）的數據類型，reference類型表示一個對象實例的引用，returnAddress已經很少見了，可以忽略。

對于64位的數據類型（Java語言中明確的64位數據類型只有long和double），虛擬機會以高位對齊的方式為其分配兩個連續的Slot空間。

虛擬機通過索引定位的方式使用局部變量表，索引值的范圍從0開始至局部變量表最大的Slot數量。訪問的是32位數據類型的變量，索引n就代表了使用第n個Slot,如果是64位數據類型，就代表會同時使用n和n+1這兩個Slot。

為了節省棧幀空間，局部變量Slot可以重用，方法體中定義的變量，其作用域并不一定會覆蓋整個方法體。如果當前字節碼PC計數器的值超出了某個變量的作用域，那么這個變量的Slot就可以交給其他變量使用。這樣的設計會帶來一些額外的副作用，比如：在某些情況下，Slot的復用會直接影響到系統的收集行為。

2.2 操作數棧

操作數棧（Operand Stack） 也常稱為操作棧，它是一個 后入先出棧。當一個方法執行開始時，這個方法的操作數棧是空的，在方法執行過程中，會有各種字節碼指令往操作數棧中寫入和提取內容，也就是 出棧/入棧操作。

在概念模型中，一個活動線程中兩個棧幀是相互獨立的。但大多數虛擬機實現都會做一些優化處理：讓下一個棧幀的部分操作數棧與上一個棧幀的部分局部變量表重疊在一起，這樣的好處是方法調用時可以共享一部分數據，而無須進行額外的參數復制傳遞。

2.3 動態連接

每個棧幀都包含一個指向運行時常量池中該棧幀所屬方法的引用，持有這個引用是為了支持方法調用過程中的 動態連接；

字節碼中方法調用指令是以常量池中的指向方法的符號引用為參數的，有一部分符號引用會在類加載階段或第一次使用的時候轉化為直接引用，這種轉化稱為 靜態解析，另外一部分在每次的運行期間轉化為直接引用，這部分稱為 動態連接。

2.4 方法返回地址

當一個方法被執行后，有兩種方式退出這個方法：

第一種是執行引擎遇到任意一個方法返回的字節碼指令，這種退出方法的方式稱為 正常完成出口（Normal Method Invocation Completion）。

另外一種是在方法執行過程中遇到了異常，并且這個異常沒有在方法體內得到處理（即本方法異常處理表中沒有匹配的異常處理器），就會導致方法退出，這種退出方式稱為 異常完成出口（Abrupt Method Invocation Completion）。
注意：這種退出方式不會給上層調用者產生任何返回值。

無論采用何種退出方式，在方法退出后，都需要返回到方法被調用的位置，程序才能繼續執行，方法返回時可能需要在棧幀中保存一些信息，用來幫助恢復它的上層方法的執行狀態。一般來說，方法正常退出時，調用者的PC計數器的值可以作為返回地址，棧幀中很可能會保存這個計數器值。而方法異常退出時，返回地址是通過異常處理器表來確定的，棧幀中一般不會保存這部分信息。

方法退出的過程實際上等同于把當前棧幀出棧，因此退出時可能執行的操作有：恢復上層方法的局部變量表和操作數棧，把返回值（如果有的話）壓入調用者棧幀的操作數棧中，調整PC計數器的值以指向方法調用指令后面的一條指令等。

2.5 附加信息

虛擬機規范允許虛擬機實現向棧幀中添加一些自定義的附加信息，例如與調試相關的信息等。

3 方法調用

方法調用階段的目的： 確定被調用方法的版本（哪一個方法），不涉及方法內部的具體運行過程，在程序運行時，進行方法調用是最普遍、最頻繁的操作。

一切方法調用在Class文件里存儲的都只是符號引用，這是需要在類加載期間或者是運行期間，才能確定為方法在實際運行時內存布局中的入口地址（相當于之前說的直接引用）。

3.1 解析

“編譯期可知，運行期不可變”的方法（靜態方法和私有方法），在類加載的解析階段，會將其符號引用轉化為直接引用（入口地址）。這類方法的調用稱為“ 解析（Resolution）”。

在Java虛擬機中提供了5條方法調用字節碼指令：

invokestatic : 調用靜態方法

invokespecial:調用實例構造器方法、私有方法、父類方法

invokevirtual:調用所有的虛方法

invokeinterface:調用接口方法，會在運行時在確定一個實現此接口的對象

invokedynamic:先在運行時動態解析出點限定符所引用的方法，然后再執行該方法，在此之前的4條調用命令的分派邏輯是固化在Java虛擬機內部的，而invokedynamic指令的分派邏輯是由用戶所設定的引導方法決定的。

3.2 分派

分派調用過程將會揭示多態性特征的一些最基本的體現，如“重載”和“重寫”在Java虛擬中是如何實現的。

1 靜態分派

所有依賴靜態類型來定位方法執行版本的分派動作，都稱為靜態分派。靜態分派發生在編譯階段。

靜態分派最典型的應用就是方法重載。

package jvm8_3_2; public class StaticDispatch { static abstract class Human { } static class Man extends Human { } static class Woman extends Human { } public void sayhello(Human guy) { System.out.println("Human guy"); } public void sayhello(Man guy) { System.out.println("Man guy"); } public void sayhello(Woman guy) { System.out.println("Woman guy"); } public static void main(String[] args) { Human man = new Man(); Human woman = new Woman(); StaticDispatch staticDispatch = new StaticDispatch(); staticDispatch.sayhello(man);// Human guy staticDispatch.sayhello(woman);// Human guy } }

運行結果：

Human guy

Human guy

為什么會出現這樣的結果呢？

Human man = new Man();其中的Human稱為變量的 靜態類型（Static Type）,Man稱為變量的 實際類型（Actual Type）。
兩者的區別是：靜態類型在編譯器可知，而實際類型到運行期才確定下來。
在重載時通過參數的靜態類型而不是實際類型作為判定依據，因此，在編譯階段，Javac編譯器會根據參數的靜態類型決定使用哪個重載版本。所以選擇了sayhello(Human)作為調用目標，并把這個方法的符號引用寫到main()方法里的兩條invokevirtual指令的參數中。
2 動態分派

在運行期根據實際類型確定方法執行版本的分派過程稱為動態分派。最典型的應用就是方法重寫。

package jvm8_3_2; public class DynamicDisptch { static abstract class Human { abstract void sayhello(); } static class Man extends Human { @Override void sayhello() { System.out.println("man"); } } static class Woman extends Human { @Override void sayhello() { System.out.println("woman"); } } public static void main(String[] args) { Human man = new Man(); Human woman = new Woman(); man.sayhello(); woman.sayhello(); man = new Woman(); man.sayhello(); } }

運行結果：

man

woman

woman

3 單分派和多分派

方法的接收者、方法的參數都可以稱為方法的宗量。根據分批基于多少種宗量，可以將分派劃分為單分派和多分派。 單分派是根據一個宗量對目標方法進行選擇的，多分派是根據多于一個的宗量對目標方法進行選擇的。

Java在進行靜態分派時，選擇目標方法要依據兩點：一是變量的靜態類型是哪個類型，二是方法參數是什么類型。因為要根據兩個宗量進行選擇，所以Java語言的靜態分派屬于多分派類型。

運行時階段的動態分派過程，由于編譯器已經確定了目標方法的簽名（包括方法參數），運行時虛擬機只需要確定方法的接收者的實際類型，就可以分派。因為是根據一個宗量作為選擇依據，所以Java語言的動態分派屬于單分派類型。

注：到JDK1.7時，Java語言還是靜態多分派、動態單分派的語言，未來有可能支持動態多分派。

4 虛擬機動態分派的實現

由于動態分派是非常頻繁的動作，而動態分派在方法版本選擇過程中又需要在方法元數據中搜索合適的目標方法，虛擬機實現出于性能的考慮，通常不直接進行如此頻繁的搜索，而是采用優化方法。

其中一種“穩定優化”手段是：在類的方法區中建立一個 虛方法表（Virtual Method Table, 也稱vtable, 與此對應，也存在接口方法表——Interface Method Table，也稱itable）。 使用虛方法表索引來代替元數據查找以提高性能。其原理與C++的虛函數表類似。

虛方法表中存放的是各個方法的實際入口地址。如果某個方法在子類中沒有被重寫，那子類的虛方法表里面的地址入口和父類中該方法相同，都指向父類的實現入口。虛方法表一般在類加載的連接階段進行初始化。

3.3 動態類型語言的支持

JDK新增加了invokedynamic指令來是實現“動態類型語言”。

靜態語言和動態語言的區別：

靜態語言（強類型語言）：
靜態語言是在編譯時變量的數據類型即可確定的語言，多數靜態類型語言要求在使用變量之前必須聲明數據類型。
例如：C++、Java、Delphi、C#等。
動態語言（弱類型語言） ：
動態語言是在運行時確定數據類型的語言。變量使用之前不需要類型聲明，通常變量的類型是被賦值的那個值的類型。
例如PHP/ASP/Ruby/Python/Perl/ABAP/SQL/JavaScript/Unix Shell等等。
強類型定義語言 ：
強制數據類型定義的語言。也就是說，一旦一個變量被指定了某個數據類型，如果不經過強制轉換，那么它就永遠是這個數據類型了。舉個例子：如果你定義了一個整型變量a,那么程序根本不可能將a當作字符串類型處理。強類型定義語言是類型安全的語言。
弱類型定義語言 ：
數據類型可以被忽略的語言。它與強類型定義語言相反, 一個變量可以賦不同數據類型的值。強類型定義語言在速度上可能略遜色于弱類型定義語言，但是強類型定義語言帶來的嚴謹性能夠有效的避免許多錯誤。

4 基于棧的字節碼解釋執行引擎

虛擬機如何調用方法的內容已經講解完畢，現在我們來探討虛擬機是如何執行方法中的字節碼指令。

4.1 解釋執行

Java語言經常被人們定位為 “解釋執行”語言，在Java初生的JDK1.0時代，這種定義還比較準確的，但當主流的虛擬機中都包含了即時編譯后，Class文件中的代碼到底會被解釋執行還是編譯執行，就成了只有虛擬機自己才能準確判斷的事情。再后來，Java也發展出來了直接生成本地代碼的編譯器[如何GCJ（GNU Compiler for the Java）]，而C/C++也出現了通過解釋器執行的版本（如CINT），這時候再籠統的說“解釋執行”，對于整個Java語言來說就成了幾乎沒有任何意義的概念， 只有確定了談論對象是某種具體的Java實現版本和執行引擎運行模式時，談解釋執行還是編譯執行才會比較確切。

Java語言中，javac編譯器完成了程序代碼經過詞法分析、語法分析到抽象語法樹，再遍歷語法樹生成線性的字節碼指令流的過程，因為這一部分動作是在Java虛擬機之外進行的，而解釋器在虛擬機內部，所以Java程序的編譯就是半獨立實現的，

4.2 基于棧的指令集和基于寄存器的指令集

Java編譯器輸出的指令流，基本上是一種 基于棧的指令集架構（Instruction Set Architecture，ISA）， 依賴操作數棧進行工作。與之相對應的另一套常用的指令集架構是 基于寄存器的指令集， 依賴寄存器進行工作。

那么， 基于棧的指令集和基于寄存器的指令集這兩者有什么不同呢？

舉個簡單例子，分別使用這兩種指令計算1+1的結果， 基于棧的指令集是這個樣子：
iconst_1
iconst_1

iadd

istore_0

兩條iconst_1指令連續把兩個常量1壓入棧后，iadd指令把棧頂的兩個值出棧、相加，然后將結果放回棧頂，最后istore_0把棧頂的值放到局部變量表中的第0個Slot中。

如果基于寄存器的指令集，那程序可能會是這個樣子：

mov eax, 1

add eax, 1

mov指令把EAX寄存器的值設置為1，然后add指令再把這個值加1，將結果就保存在EAX寄存器里面。

基于棧的指令集主要的優點就是可移植，寄存器是由硬件直接提供，程序直接依賴這些硬件寄存器則不可避免地要受到硬件的約束。

棧架構的指令集還有一些其他的優點，如代碼相對更加緊湊，編譯器實現更加簡單等。
棧架構指令集的主要缺點是執行速度相對來說會稍微慢一些。

總結

本節中，我們分析了虛擬機在執行代碼時，如何找到正確的方法、如何執行方法內的字節碼，以及執行代碼時涉及的內存結構。

向AI問一下細節

推薦閱讀：

深入理解HTML5 2

深入理解HTML5

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

jvm 字節引擎

上一篇新聞：
利用JavaScript編寫更好條件語句的方法

下一篇新聞：
2009-05-19--05-20 MySQL學習筆記02

猜你喜歡

在PHP項目中如何選擇合適的圖片處理庫

ImageCopyResized函數與GD庫的關系

PHP中session()函數的作用是什么

如何在PHP中使用session()函數存儲數據

session()函數在PHP中的生命周期是怎樣的

PHP中session()函數的存儲機制有哪些

如何設置PHP session的超時時間

在PHP中如何銷毀session數據

session()函數在不同服務器環境下的表現

PHP中session數據的加密與解密方法

最新資訊

C++ hook庫的代碼示例有哪些

C++ hook庫的跨平臺能力怎樣

C++ hook庫的內存管理機制

C++ hook庫的多線程支持如何

C++ hook庫的兼容性測試報告

C++ hook庫的安全更新頻率

C++ hook庫的性能優化建議

C++ hook庫的日志記錄功能

C++ hook庫的錯誤處理機制

C++ hook庫的API設計如何

相關推薦

深入理解JVM虛擬機9：JVM監控工具與診斷實踐

深入理解JVM虛擬機12：JVM性能管理神器VisualVM介紹與實戰

深入理解JVM字節碼執行引擎

Java的字節碼如何理解

JVM虛擬機指的是什么

怎樣解析JVM虛擬機

JVM虛擬機底層原理是什么

如何理解Java JVM虛擬機中init和clinit的區別

虛擬機中的字節碼執行引擎是什么

Java?JVM虛擬機調優的方法

相關標簽

jvm內存 jvm內存結構 jvm監控工具 jvm類加載器 jvm類加載機制 jvm垃圾收集器 jvm類 jvm、gc jvm gc

中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

深入理解JVM虛擬機5：虛擬機字節碼執行引擎

1 概述

2 運行時棧幀結構

2.1 局部變量表

2.2 操作數棧

2.3 動態連接

2.4 方法返回地址

2.5 附加信息

3 方法調用

3.1 解析

3.2 分派

3.3 動態類型語言的支持

4 基于棧的字節碼解釋執行引擎

4.1 解釋執行

4.2 基于棧的指令集和基于寄存器的指令集

總結

猜你喜歡

最新資訊

相關推薦

相關標簽