您好,登錄后才能下訂單哦!
本篇內容介紹了“Linux內核提供的常見的進程通信機制有哪些”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
顧名思義,進程通信( InterProcess Communication,IPC)就是指「進程之間的信息交換」。實際上,「進程的同步與互斥本質上也是一種進程通信」(這也就是待會我們會在進程通信機制中看見信號量和 PV 操作的原因了),只不過它傳輸的僅僅是信號量,通過修改信號量,使得進程之間建立聯系,相互協調和協同工作,但是它「缺乏傳遞數據的能力」。
雖然存在某些情況,進程之間交換的信息量很少,比如僅僅交換某個狀態信息,這樣進程的同步與互斥機制完全可以勝任這項工作。但是大多數情況下,「進程之間需要交換大批數據」,比如傳送一批信息或整個文件,這就需要通過一種新的通信機制來完成,也就是所謂的進程通信。
再來從操作系統層面直觀的看一些進程通信:我們知道,為了保證安全,每個進程的用戶地址空間都是獨立的,一般而言一個進程不能直接訪問另一個進程的地址空間,不過內核空間是每個進程都共享的,所以「進程之間想要進行信息交換就必須通過內核」。
下面就來我們來列舉一下 Linux 內核提供的常見的進程通信機制:
各位如果學過 Linux 命令,那對管道肯定不陌生,Linux 管道使用豎線 |
連接多個命令,這被稱為管道符。
$ command1 | command2
以上這行代碼就組成了一個管道,它的功能是將前一個命令(command1
)的輸出,作為后一個命令(command2
)的輸入,從這個功能描述中,我們可以看出「管道中的數據只能單向流動」,也就是半雙工通信,如果想實現相互通信(全雙工通信),我們需要創建兩個管道才行。
另外,通過管道符 |
創建的管道是匿名管道,用完了就會被自動銷毀。并且,匿名管道只能在具有親緣關系(父子進程)的進程間使用,。也就是說,「匿名管道只能用于父子進程之間的通信」。
在 Linux 的實際編碼中,是通過 pipe
函數來創建匿名管道的,若創建成功則返回 0,創建失敗就返回 -1:
int pipe (int fd[2]);
該函數擁有一個存儲空間為 2 的文件描述符數組:
fd[0]
指向管道的讀端,
fd[1]
指向管道的寫端fd[1]
的輸出是
fd[0]
的輸入粗略的解釋一下通過匿名管道實現進程間通信的步驟:
1)父進程創建兩個匿名管道,管道 1(fd1[0]
和 fd1[1]
)和管道 2(fd2[0]
和 fd2[1]
);
?因為管道的數據是單向流動的,所以要想實現數據雙向通信,就需要兩個管道,每個方向一個。
?
2)父進程 fork 出子進程,于是對于這兩個匿名管道,子進程也分別有兩個文件描述符指向匿名管道的讀寫兩端;
3)父進程關閉管道 1 的讀端 fd1[0]
和 管道 2 的寫端 fd2[1]
,子進程關閉管道 1 的寫端 fd1[1]
和 管道 2 的讀端 fd2[0]
,這樣,管道 1 只能用于父進程寫、子進程讀;管道 2 只能用于父進程讀、子進程寫。管道是用「環形隊列」實現的,數據從寫端流入從讀端流出,這就實現了父子進程之間的雙向通信。
看完上面這些講述,我們來理解下管道的本質是什么:對于管道兩端的進程而言,管道就是一個文件(這也就是為啥管道也被稱為共享文件機制的原因了),但它不是普通的文件,它不屬于某種文件系統,而是自立門戶,單獨構成一種文件系統,并且只存在于內存中。
簡單來說,「管道的本質就是內核在內存中開辟了一個緩沖區,這個緩沖區與管道文件相關聯,對管道文件的操作,被內核轉換成對這塊緩沖區的操作」。
匿名管道由于沒有名字,只能用于父子進程間的通信。為了克服這個缺點,提出了有名管道,也稱做 FIFO
,因為數據是先進先出的傳輸方式。
所謂有名管道也就是提供一個路徑名與之關聯,這樣,即使與創建有名管道的進程不存在親緣關系的進程,只要可以訪問該路徑,就能夠通過這個有名管道進行相互通信。
使用 Linux 命令 mkfifo
來創建有名管道:
$ mkfifo myPipe
myPipe
就是這個管道的名稱,接下來,我們往 myPipe 這個有名管道中寫入數據:
$ echo "hello" > myPipe
執行這行命令后,你會發現它就停在這了,這是因為管道里的內容沒有被讀取,只有當管道里的數據被讀完后,命令才可以正常退出。于是,我們執行另外一個命令來讀取這個有名管道里的數據:
$ cat < myPipe
hello
可以看出,「管道這種進程通信方式雖然使用簡單,但是效率比較低,不適合進程間頻繁地交換數據,并且管道只能傳輸無格式的字節流」。為此,消息傳遞機制(Linux 中稱消息隊列)應用而生。比如,A 進程要給 B 進程發送消息,A 進程把數據放在對應的消息隊列后就可以正常返回了,B 進程在需要的時候自行去消息隊列中讀取數據就可以了。同樣的,B 進程要給 A 進程發送消息也是如此。
「消息隊列的本質就是存放在內存中的消息的鏈表,而消息本質上是用戶自定義的數據結構」。如果進程從消息隊列中讀取了某個消息,這個消息就會被從消息隊列中刪除。對比一下管道機制:
需要注意的是,消息隊列對于交換較少數量的數據很有用,因為無需避免沖突。但是,由于用戶進程寫入數據到內存中的消息隊列時,會發生從用戶態「拷貝」數據到內核態的過程;同樣的,另一個用戶進程讀取內存中的消息數據時,會發生從內核態拷貝數據到用戶態的過程。因此,「如果數據量較大,使用消息隊列就會造成頻繁的系統調用,也就是需要消耗更多的時間以便內核介入」。
為了避免像消息隊列那樣頻繁的拷貝消息、進行系統調用,共享內存機制出現了。
顧名思義,共享內存就是允許不相干的進程將同一段物理內存連接到它們各自的地址空間中,使得這些進程可以訪問同一個物理內存,這個物理內存就成為共享內存。如果某個進程向共享內存寫入數據,所做的改動將「立即」影響到可以訪問同一段共享內存的任何其他進程。
集合內存管理的內容,我們來深入理解下共享內存的原理。首先,每個進程都有屬于自己的進程控制塊(PCB)和邏輯地址空間(Addr Space),并且都有一個與之對應的頁表,負責將進程的邏輯地址(虛擬地址)與物理地址進行映射,通過內存管理單元(MMU)進行管理。「兩個不同進程的邏輯地址通過頁表映射到物理空間的同一區域,它們所共同指向的這塊區域就是共享內存」。
不同于消息隊列頻繁的系統調用,對于共享內存機制來說,僅在建立共享內存區域時需要系統調用,一旦建立共享內存,所有的訪問都可作為常規內存訪問,無需借助內核。這樣,數據就不需要在進程之間來回拷貝,所以這是最快的一種進程通信方式。
實際上,對具有多 CPU 系統的最新研究表明,在這類系統上,消息傳遞的性能其實是要優于共享內存的,因為「消息隊列無需避免沖突,而共享內存機制可能會發生沖突」。也就是說如果多個進程同時修改同一個共享內存,先來的那個進程寫的內容就會被后來的覆蓋。
并且,在多道批處理系統中,多個進程是可以并發執行的,但由于系統的資源有限,進程的執行不是一貫到底的, 而是走走停停,以不可預知的速度向前推進(異步性)。但有時候我們又希望多個進程能密切合作,按照某個特定的順序依次執行,以實現一個共同的任務。
舉個例子,如果有 A、B 兩個進程分別負責讀和寫數據的操作,這兩個線程是相互合作、相互依賴的。那么寫數據應該發生在讀數據之前。而實際上,由于異步性的存在,可能會發生先讀后寫的情況,而此時由于緩沖區還沒有被寫入數據,讀進程 A 沒有數據可讀,因此讀進程 A 被阻塞。
因此,為了解決上述這兩個問題,保證共享內存在任何時刻只有一個進程在訪問(互斥),并且使得進程們能夠按照某個特定順序訪問共享內存(同步),我們就可以使用進程的同步與互斥機制,常見的比如信號量與 PV 操作。
「進程的同步與互斥其實是一種對進程通信的保護機制,并不是用來傳輸進程之間真正通信的內容的,但是由于它們會傳輸信號量,所以也被納入進程通信的范疇,稱為低級通信」。
?下面的內容和上篇文章【看完了進程同步與互斥機制,我終于徹底理解了 PV 操作】中所講的差不多,看過的小伙伴可直接跳到下一標題。
?
信號量其實就是一個變量 ,我們可以用一個信號量來表示系統中某種資源的數量,比如:系統中只有一臺打印機,就可以設置一個初值為 1 的信號量。
用戶進程可以通過使用操作系統提供的一對原語來對信號量進行操作,從而很方便的實現進程互斥或同步。這一對原語就是 PV 操作:
1)「P 操作」:將信號量值減 1,表示「申請占用一個資源」。如果結果小于 0,表示已經沒有可用資源,則執行 P 操作的進程被阻塞。如果結果大于等于 0,表示現有的資源足夠你使用,則執行 P 操作的進程繼續執行。
可以這么理解,當信號量的值為 2 的時候,表示有 2 個資源可以使用,當信號量的值為 -2 的時候,表示有兩個進程正在等待使用這個資源。不看這句話真的無法理解 V 操作,看完頓時如夢初醒。
2)「V 操作」:將信號量值加 1,表示「釋放一個資源」,即使用完資源后歸還資源。若加完后信號量的值小于等于 0,表示有某些進程正在等待該資源,由于我們已經釋放出一個資源了,因此需要喚醒一個等待使用該資源(就緒態)的進程,使之運行下去。
我覺得已經講的足夠通俗了,不過對于 V 操作大家可能仍然有困惑,下面再來看兩個關于 V 操作的問答:
問:「信號量的值 大于 0 表示有共享資源可供使用,這個時候為什么不需要喚醒進程」?
答:所謂喚醒進程是從就緒隊列(阻塞隊列)中喚醒進程,而信號量的值大于 0 表示有共享資源可供使用,也就是說這個時候沒有進程被阻塞在這個資源上,所以不需要喚醒,正常運行即可。
問:「信號量的值 等于 0 的時候表示沒有共享資源可供使用,為什么還要喚醒進程」?
答:V 操作是先執行信號量值加 1 的,也就是說,把信號量的值加 1 后才變成了 0,在此之前,信號量的值是 -1,即有一個進程正在等待這個共享資源,我們需要喚醒它。
信號量和 PV 操作具體的定義如下:
兩步走即可實現不同進程對共享內存的互斥訪問:
「P 操作和 V 操作必須成對出現」。缺少 P 操作就不能保證對共享內存的互斥訪問,缺少 V 操作就會導致共享內存永遠得不到釋放、處于等待態的進程永遠得不到喚醒。
回顧一下進程同步,就是要各并發進程按要求有序地運行。
舉個例子,以下兩個進程 P1、P2 并發執行,由于存在異步性,因此二者交替推進的次序是不確定的。假設 P2 的 “代碼4” 要基于 P1 的 “代碼1” 和 “代碼2” 的運行結果才能執行,那么我們就必須保證 “代碼4” 一定是在 “代碼2” 之后才會執行。
如果 P2 的 “代碼4” 要基于 P1 的 “代碼1” 和 “代碼2” 的運行結果才能執行,那么我們就必須保證 “代碼4” 一定是在 “代碼2” 之后才會執行。
使用信號量和 PV 操作實現進程的同步也非常方便,三步走:
配合下面這張圖直觀理解下:
注意!「信號和信號量是完全不同的兩個概念」!
信號是進程通信機制中唯一的「異步」通信機制,它可以在任何時候發送信號給某個進程。「通過發送指定信號來通知進程某個異步事件的發送,以迫使進程執行信號處理程序。信號處理完畢后,被中斷進程將恢復執行」。用戶、內核和進程都能生成和發送信號。
信號事件的來源主要有硬件來源和軟件來源。所謂硬件來源就是說我們可以通過鍵盤輸入某些組合鍵給進程發送信號,比如常見的組合鍵 Ctrl+C 產生 SIGINT
信號,表示終止該進程;而軟件來源就是通過 kill
系列的命令給進程發送信號,比如 kill -9 1111
,表示給 PID 為 1111 的進程發送 SIGKILL
信號,讓其立即結束。我們來查看一下 Linux 中有哪些信號:
至此,上面介紹的 5 種方法都是用于同一臺主機上的進程之間進行通信的,如果想要「跨網絡與不同主機上的進程進行通信」,那該怎么做呢?這就是 Socket 通信做的事情了(「當然,Socket 也能完成同主機上的進程通信」)。
Socket 起源于 Unix,原意是「插座」,在計算機通信領域,Socket 被翻譯為「套接字」,它是計算機之間進行通信的一種約定或一種方式。通過 Socket 這種約定,一臺計算機可以接收其他計算機的數據,也可以向其他計算機發送數據。
從計算機網絡層面來說,「Socket 套接字是網絡通信的基石」,是支持 TCP/IP 協議的網絡通信的基本操作單元。它是網絡通信過程中端點的抽象表示,包含進行網絡通信必須的五種信息:連接使用的協議,本地主機的 IP 地址,本地進程的協議端口,遠地主機的 IP 地址,遠地進程的協議端口。
Socket 的本質其實是一個編程接口(API),是應用層與 TCP/IP 協議族通信的中間軟件抽象層,它對 TCP/IP 進行了封裝。它「把復雜的 TCP/IP 協議族隱藏在 Socket 接口后面」。對用戶來說,只要通過一組簡單的 API 就可以實現網絡的連接。
簡單總結一下上面六種 Linux 內核提供的進程通信機制:
1)首先,最簡單的方式就是「管道」,管道的本質是存放在內存中的特殊的文件。也就是說,內核在內存中開辟了一個緩沖區,這個緩沖區與管道文件相關聯,對管道文件的操作,被內核轉換成對這塊緩沖區的操作。管道分為匿名管道和有名管道,匿名管道只能在父子進程之間進行通信,而有名管道沒有限制。
2)雖然管道使用簡單,但是效率比較低,不適合進程間頻繁地交換數據,并且管道只能傳輸無格式的字節流。為此「消息隊列」應用而生。消息隊列的本質就是存放在內存中的消息的鏈表,而消息本質上是用戶自定義的數據結構。如果進程從消息隊列中讀取了某個消息,這個消息就會被從消息隊列中刪除。
3)消息隊列的速度比較慢,因為每次數據的寫入和讀取都需要經過用戶態與內核態之間數據的拷貝過程,「共享內存」可以解決這個問題。所謂共享內存就是:兩個不同進程的邏輯地址通過頁表映射到物理空間的同一區域,它們所共同指向的這塊區域就是共享內存。如果某個進程向共享內存寫入數據,所做的改動將立即影響到可以訪問同一段共享內存的任何其他進程。
對于共享內存機制來說,僅在建立共享內存區域時需要系統調用,一旦建立共享內存,所有的訪問都可作為常規內存訪問,無需借助內核。這樣,數據就不需要在進程之間來回拷貝,所以這是最快的一種進程通信方式。
4)共享內存速度雖然非常快,但是存在沖突問題,為此,我們可以使用信號量和 PV 操作來實現對共享內存的互斥訪問,并且還可以實現進程同步。
5)「信號」和信號量是完全不同的兩個概念!信號是進程通信機制中唯一的異步通信機制,它可以在任何時候發送信號給某個進程。通過發送指定信號來通知進程某個異步事件的發送,以迫使進程執行信號處理程序。信號處理完畢后,被中斷進程將恢復執行。用戶、內核和進程都能生成和發送信號。
6)上面介紹的 5 種方法都是用于同一臺主機上的進程之間進行通信的,如果想要跨網絡與不同主機上的進程進行通信,就需要使用 「Socket」 通信。另外,Socket 也能完成同主機上的進程通信。
“Linux內核提供的常見的進程通信機制有哪些”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。