中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

漫游計算機系統之虛擬存儲器

發布時間:2020-09-04 08:33:11 來源:網絡 閱讀:1681 作者:鄔領東 欄目:軟件技術

漫游計算機系統之虛擬存儲器

1. 背景

一個典型的計算機系統如下圖所示:
漫游計算機系統之虛擬存儲器
直接讓應用使用硬件可能會導致濫用,并且應用需要處理復雜的硬件細節,容易出錯。所以我們引入了操作系統來管理硬件資源,如下圖所示:
漫游計算機系統之虛擬存儲器
操作系統為了讓應用能更好更簡單地使用硬件資源,對硬件資源做了進一步抽象,如下圖所示:
漫游計算機系統之虛擬存儲器

2. 虛擬存儲器

虛擬存儲器把進程訪問的存儲設備抽象成一個巨大的字節數組,并對每個字節做唯一的地址編碼。它提供了三個重要的功能:

  1. 將主存看做存儲在磁盤上的地址空間的高速緩存,從而提高了主存使用效率。
  2. 為每個進程提供一致的地址空間,簡化存儲器管理。
  3. 保護每個進程的地址空間不被其他進程破壞。

虛擬存儲器在幕后自動地工作,無需應用程序員干涉,既然如此,為什么我們還需要去理解它呢?我想理解它可以帶來以下幾點好處:

  1. 虛擬存儲器是計算機系統的核心。它涉及計算機系統的所有層面(硬件異常、匯編器、鏈接器、加載器、共享對象、文件、進程),理解它將幫助我們更好地理解計算機系統是怎么工作的。
  2. 虛擬存儲器的功能非常強大。它賦予應用程序強大的功能,比如加載一個文件到存儲器中,不需要任何顯示拷貝。
  3. 虛擬存儲器非常危險。對于編寫像c/c++程序,一個錯誤指針就可以讓程序立即崩潰。理解它可以讓我們更好地避免錯誤;或者當錯誤發生時,更好地定位問題所在。

3. 虛擬尋址

進程看到是虛擬地址,但是信息是存在物理內存上的,那么系統是如何用虛擬地址來獲取對應物理內存的字節信息的呢?簡單來說,可以分為三步:

  1. CPU會把虛擬地址發送到MMU(Memory Management Unit)
  2. MMU把虛擬地址翻譯為物理地址后傳送給主存
  3. 主存把物理地址對應的字節傳送給CPU

具體過程如下圖:
漫游計算機系統之虛擬存儲器

3.1. 頁表

MMU是如何把虛擬地址翻譯為物理地址的呢?
OS會把物理內存、虛擬內存分為同樣大小的塊(linux默認為4k),并稱之為頁。同時為每個進程分配頁表,頁表是一個頁表條目(PTE)數組,其中每個PTE記錄了虛擬頁與物理頁的映射關系。
漫游計算機系統之虛擬存儲器
一個虛擬地址可以分為兩部分:虛擬頁號×××和虛擬頁偏移量VPO。由于虛擬頁與物理頁是同樣大小,因此虛擬頁偏移量就是物理頁偏移量;虛擬頁號是頁表中PTE的索引,對應的PTE中存儲著物理頁號和有效位(表示頁面是否有對應物理頁),這樣MMU通過查詢PTE就可以找到虛擬頁對應的物理頁,再加上虛擬頁偏移量就可以得到物理地址,如下圖:

漫游計算機系統之虛擬存儲器

3.2. 多級頁表

如果每個進程只有一個頁表(假設物理頁大小為4k),那么對于32位系統,需要占用4M內存(每個PTE是4字節);對于64位系統(實際只用了48位用來尋址),則需要256G內存,實在是太大了。為了解決這個問題,我們用多級頁表,如下圖:
漫游計算機系統之虛擬存儲器
在多級頁表中,所有級別的頁表大小是一樣的,我們以linux的4級頁表為例,則最少要4個頁表,假設一個頁表4k,總共16k;隨著進程消耗內存的增長,第k級頁表數目隨之線性增長,由于其他級別的頁表數目遠遠小于k級頁表,因此總頁表消耗內存頁頁接近于線性增長。由于進程實際占用內存大小遠小于256T,因此頁表消耗內存遠小于一級頁表。

4. 進程內存布局

從上述小結,我們知道每個進程都有一個獨立的虛擬存儲器空間,那么其布局是否有規律呢?我們以linux下的64位進程舉例,見下圖:
漫游計算機系統之虛擬存儲器
linux將用戶虛擬存儲器組織成一些段的集合。一個段就是已分配的虛擬存儲器的連續片。只有存在于段的虛擬存儲器頁是可以被進程訪問的。

#include <stdlib.h>

int main()
{
    char *p = (char*)malloc(1);
    while(1);
    return 0;
}

編譯上述代碼并運行,通過top獲取此進程PID后,我們可以打開/proc/PID/maps文件查看進程的內存布局:

00400000-00401000 r-xp 00000000 fd:01 723899                             /home/wld/test/a.out
00600000-00601000 r--p 00000000 fd:01 723899                             /home/wld/test/a.out
00601000-00602000 rw-p 00001000 fd:01 723899                             /home/wld/test/a.out
0148c000-014ad000 rw-p 00000000 00:00 0                                  [heap]
7fb917267000-7fb917425000 r-xp 00000000 fd:01 1731435                    /lib/x86_64-linux-gnu/libc-2.19.so
7fb917425000-7fb917625000 ---p 001be000 fd:01 1731435                    /lib/x86_64-linux-gnu/libc-2.19.so
7fb917625000-7fb917629000 r--p 001be000 fd:01 1731435                    /lib/x86_64-linux-gnu/libc-2.19.so
7fb917629000-7fb91762b000 rw-p 001c2000 fd:01 1731435                    /lib/x86_64-linux-gnu/libc-2.19.so
7fb91762b000-7fb917630000 rw-p 00000000 00:00 0
7fb917630000-7fb917653000 r-xp 00000000 fd:01 1731443                    /lib/x86_64-linux-gnu/ld-2.19.so
7fb917835000-7fb917838000 rw-p 00000000 00:00 0
7fb917850000-7fb917852000 rw-p 00000000 00:00 0
7fb917852000-7fb917853000 r--p 00022000 fd:01 1731443                    /lib/x86_64-linux-gnu/ld-2.19.so
7fb917853000-7fb917854000 rw-p 00023000 fd:01 1731443                    /lib/x86_64-linux-gnu/ld-2.19.so
7fb917854000-7fb917855000 rw-p 00000000 00:00 0
7ffe8b3e1000-7ffe8b402000 rw-p 00000000 00:00 0                          [stack]
7ffe8b449000-7ffe8b44b000 r--p 00000000 00:00 0                          [vvar]
7ffe8b44b000-7ffe8b44d000 r-xp 00000000 00:00 0                          [vdso]
ffffffffff600000-ffffffffff601000 r-xp 00000000 00:00 0                  [vsyscall]

上面每一行表示一個段,每個段的有6列,各列含義如下:

  1. 此段虛擬地址空間起始地址-結束地址。
  2. 此段虛擬地址空間的屬性。每種屬性用一個字段表示,r表示可讀,w表示可寫,x表示可執行,p和s共用一個字段,互斥關系,p表示私有段,s表示共享段,如果沒有相應權限,則用’-’代替。
  3. 對有名映射,表示此段虛擬存儲器起始地址在文件中以頁為單位的偏移。對匿名映射,它等于0或者vm_start/PAGE_SIZE。
  4. 映射文件所屬設備號。對匿名映射來說,因為沒有文件在磁盤上,所以沒有設備號,始終為00:00。對有名映射來說,是映射的文件所在設備的設備號
  5. 映射文件所屬節點號。對匿名映射來說,因為沒有文件在磁盤上,所以沒有節點號,始終為00:00。對有名映射來說,是映射的文件的節點號
  6. 對有名來說,是映射的文件名。對匿名映射來說,是此段虛擬存儲器在進程中的角色。[stack]表示在進程中作為棧使用,[heap]表示堆。其余情況則無顯示

5. 缺頁異常處理

假如MMU在嘗試翻譯某個虛擬地址A時,沒有對應的物理地址,則會觸發了一個缺頁異常。這個異常會導致控制轉移到內核的缺頁異常處理程序,處理程序隨后執行如下步驟:

  1. 虛擬地址是合法的嗎?即虛擬地址是否在已分配的段的地址范圍內。如果找不到就會觸發段錯誤。
  2. 試圖進行的虛擬地址訪問是合法的嗎?即權限是否符合所在段的權限。如果沒有權限就會觸發保護異常。
  3. 分配物理頁,更新頁表。缺頁處理程序返回時,CPU會重新執行引起缺頁的指令。

通過執行以下兩種的任意一種命令可查看某個進程的缺頁中斷信息
ps -o majflt,minflt -C program_name
ps -o majflt,minflt -p pid
majflt和minor這兩個數值表示一個進程自啟動以來所發生的缺頁中斷的次數。
其中majflt與minflt的不同是,majflt表示需要讀寫磁盤,可能是內存對應頁面在磁盤中需要load到物理內存中,也可能是此時物理內存不足,需要淘汰部分物理頁面至磁盤中。

6. 內存映射

linux通過將虛擬內地段與一個磁盤上的文件關聯起來,以初始化這個虛擬存儲器段的內容,這個過程稱之為內存映射(memory mapping)。內存映射有兩種:

  1. 有名文件映射:一個段可以映射到一個普通磁盤文件的連續部分,例如一個可執行文件。
  2. 匿名文件映射:一個段也可以映射到一個匿名文件,匿名文件由內核創建,包含的是全二進制零。

###6.1 共享對象
內存映射可以讓我們簡單高效地把程序和數據加載到虛擬存儲器空間中。在實際中,許多進程會映射同一個文件到內存中,比如glic動態庫,如果物理內存中存在多份,那就是極端的浪費。我們可以通過共享對象技術來消除浪費。
漫游計算機系統之虛擬存儲器
對于私有對象,我們可以用寫時拷貝技術來共享物理內存頁。
漫游計算機系統之虛擬存儲器

6.2 思考題

  1. 能否通過動態庫的全局變量在進程間傳遞信息?
  2. 進程A使用動態庫S,更新S版本,再啟動使用S的進程B后,進程A是否還能正常訪問S的函數?

7. 動態內存分配

類unix操作系統下的動態內存分配器有很多,比如ptmalloc(linux默認),tcmalloc(google出品),jemalloc(FreeBSD、NetBSD和firefox默認)。這三種分配器的詳細介紹可以參考http://www.360doc.com/content/13/0915/09/8363527_314549128.shtml。
本文以ptmalloc為例介紹動態內存分配。在linux下os提供兩種動態內存分配brk和mmap。ptmalloc對于申請內存小于128k的采用brk方式,大于128k的采用mmap方式。

7.1. mmap

對于大內存,malloc會直接調用系統函數mmap分配內存,以物理頁為最小單位做對齊。free會直接調用系統函數munmap釋放內存。

7.2. brk

進程有一個指針指向堆的頂部的地址,通過系統函數brk可以改變這個指針的位置,從而改變堆的大小(堆可以擴大也可以收縮)。當已有的堆不能分配內存時,brk會擴大堆來分配動態內存。當頂部的內存被釋放,切釋放內存大于128k,brk就會收縮堆,如下圖:
漫游計算機系統之虛擬存儲器
從上面的堆分配釋放方式,我們知道實際上很多小內存申請后是不會馬上釋放給OS,為了將這些內存重復利用,內存分配器需要由一個算法,下面介紹下ptmalloc是如何處理的。

7.3. ptmalloc

ptmalloc通過chunk的數據結構來組織每個內存單元。當我們使用malloc分配得到一塊內存的時候,這塊內存就會通過chunk的形式被記錄到glibc上并且管理起來。你可以把它想象成自己寫內存池的時候的一個內存數據結構。chunk的結構可以分為使用中的chunk和空閑的chunk。使用中的chunk和空閑的chunk數據結構基本項同,但是會有一些設計上的小技巧,巧妙的節省了內存。
使用中的chunk:
漫游計算機系統之虛擬存儲器

  1. chunk指針指向chunk開始的地址;mem指針指向用戶內存塊開始的地址。
  2. p=0時,表示前一個chunk為空閑,prev_size才有效
  3. p=1時,表示前一個chunk正在使用,prev_size無效 p主要用于內存塊的合并操作
  4. ptmalloc 分配的第一個塊總是將p設為1, 以防止程序引用到不存在的區域
  5. M=1 為mmap映射區域分配;M=0為heap區域分配
  6. A=1 為非主分區分配;A=0 為主分區分配

空閑的chunk結構會復用User data來保存雙向鏈表指針。

漫游計算機系統之虛擬存儲器
ptmalloc一共維護了128bin。每個bins都維護了大小相近的雙向鏈表的chunk。
通過上圖這個bins的列表就能看出,當用戶調用malloc的時候,能很快找到用戶需要分配的內存大小是否在維護的bin上,如果在某一個bin上,就可以通過雙向鏈表去查找合適的chunk內存塊給用戶使用。

  1. fast bins。fast bins是bins的高速緩沖區,大約有10個定長隊列。當用戶釋放一塊不大于max_fast(默認值64)的chunk(一般小內存)的時候,會默認會被放到fast bins上。當用戶下次需要申請內存的時候首先會到fast bins上尋找是否有合適的chunk,然后才會到bins上空閑的chunk。ptmalloc會遍歷fast bin,看是否有合適的chunk需要合并到bins上。
  2. unsorted bin。是bins的一個緩沖區。當用戶釋放的內存大于max_fast或者fast bins合并后的chunk都會進入unsorted bin上。當用戶malloc的時候,先會到unsorted bin上查找是否有合適的bin,如果沒有合適的bin,ptmalloc會將unsorted bin上的chunk放入bins上,然后到bins上查找合適的空閑chunk。
  3. small bins和large bins。small bins和large bins是真正用來放置chunk雙向鏈表的。每個bin之間相差8個字節,并且通過上面的這個列表,可以快速定位到合適大小的空閑chunk。前64個為small bins,定長;后64個為large bins,非定長。
  4. Top chunk。并不是所有的chunk都會被放到bins上。top chunk相當于分配區的頂部空閑內存,當bins上都不能滿足內存分配要求的時候,就會來top chunk上分配。
  5. mmaped chunk。當分配的內存非常大(大于分配閥值,默認128K)的時候,需要被mmap映射,則會放到mmaped chunk上,當釋放mmaped chunk上的內存的時候會直接交還給操作系統。
7.3.1. 內存分配malloc流程
  1. 獲取分配區的鎖,防止多線程沖突。
  2. 計算出需要分配的內存的chunk實際大小。
  3. 判斷chunk的大小,如果小于max_fast(64b),則取fast bins上去查詢是否有適合的chunk,如果有則分配結束。
  4. chunk大小是否小于512B,如果是,則從small bins上去查找chunk,如果有合適的,則分配結束。
  5. 繼續從 unsorted bins上查找。如果unsorted bins上只有一個chunk并且大于待分配的chunk,則進行切割,并且剩余的chunk繼續扔回unsorted bins;如果unsorted bins上有大小和待分配chunk相等的,則返回,并從unsorted bins刪除;如果unsorted bins中的某一chunk大小 屬于small bins的范圍,則放入small bins的頭部;如果unsorted bins中的某一chunk大小 屬于large bins的范圍,則找到合適的位置放入。
  6. 從large bins中查找,找到鏈表頭后,反向遍歷此鏈表,直到找到第一個大小 大于待分配的chunk,然后進行切割,如果有余下的,則放入unsorted bin中去,分配則結束。
  7. 如果搜索fast bins和bins都沒有找到合適的chunk,那么就需要操作top chunk來進行分配了(top chunk相當于分配區的剩余內存空間)。判斷top chunk大小是否滿足所需chunk的大小,如果是,則從top chunk中分出一塊來。
  8. 如果top chunk也不能滿足需求,則需要擴大top chunk。主分區上,如果分配的內存小于分配閥值(默認128k),則直接使用brk()分配一塊內存;如果分配的內存大于分配閥值,則需要mmap來分配;非主分區上,則直接使用mmap來分配一塊內存。通過mmap分配的內存,就會放入mmap chunk上,mmap chunk上的內存會直接回收給操作系統。
7.3.2. 內存釋放free流程
  1. 獲取分配區的鎖,保證線程安全。
  2. 如果free的是空指針,則返回,什么都不做。
  3. 判斷當前chunk是否是mmap映射區域映射的內存,如果是,則直接munmap()釋放這塊內存。前面的已使用chunk的數據結構中,我們可以看到有M來標識是否是mmap映射的內存。
  4. 判斷chunk是否與top chunk相鄰,如果相鄰,則直接和top chunk合并(和top chunk相鄰相當于和分配區中的空閑內存塊相鄰)。轉到步驟8
  5. 如果chunk的大小大于max_fast(64b),則放入unsorted bin,并且檢查是否有合并,有合并情況并且和top chunk相鄰,則轉到步驟8;沒有合并情況則free。
  6. 如果chunk的大小小于 max_fast(64b),則直接放入fast bin,fast bin并沒有改變chunk的狀態。沒有合并情況,則free;有合并情況,轉到步驟7
  7. 在fast bin,如果當前chunk的下一個chunk也是空閑的,則將這兩個chunk合并,放入unsorted bin上面。合并后的大小如果大于64KB,會觸發進行fast bins的合并操作,fast bins中的chunk將被遍歷,并與相鄰的空閑chunk進行合并,合并后的chunk會被放到unsorted bin中,fast bin會變為空。合并后的chunk和topchunk相鄰,則會合并到topchunk中。轉到步驟8
  8. 判斷top chunk的大小是否大于mmap收縮閾值(默認為128KB),如果是的話,對于主分配區,則會試圖歸還top chunk中的一部分給操作系統。free結束。

7.4. 內存碎片

造成堆利用率低的主要原因是碎片,當雖然有未使用的內存但不能用來滿足分配請求時,就會發生這種現象。有兩種形式的碎片:

  1. 內部碎片:已分配塊比有效載荷大。往往在實現內存池或者自己管理內存時會存在內部碎片。
  2. 外部碎片:空閑內存合起來可以滿足分配要求,但是沒有一個單獨的空閑塊足夠大可以滿足分配請求。目前一些好的第三方分配器,如tcmalloc、jemalloc可以很好地解決外部碎片問題。

7.5. 思考題

####提問1:請問下面代碼運行后,OS會立即分配1G物理內存嗎?

#include <cstdlib>

int main()
{
    char *p = (char*)malloc(1024*1024*1024);
    while(1);
    return 0;
}

###提問2:請問下面代碼運行后,OS會分配多少物理內存?

#include <cstdlib>
#include <cstring>

int main()
{
    const size_t MAX_LEN = 1024*1024*1024;
    char *p = (char*)malloc(MAX_LEN);
    memset(p, 0, MAX_LEN/2);
    while(1);
    return 0;
}
向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

墨脱县| 龙游县| 济宁市| 焦作市| 阿坝县| 上犹县| 涞源县| 措勤县| 花垣县| 台中县| 新蔡县| 屏东县| 柘荣县| 新龙县| 固安县| 五莲县| 江达县| 保康县| 十堰市| 龙州县| 中江县| 绿春县| 云龙县| 大理市| 达州市| 那坡县| 襄樊市| 南乐县| 榆树市| 怀柔区| 吉隆县| 绍兴县| 岫岩| 九江市| 永清县| 那曲县| 定远县| 游戏| 古田县| 华亭县| 尚志市|