您好,登錄后才能下訂單哦!
這篇文章主要介紹了Netty中粘包和半包產生原因有哪些,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
TCP 傳輸中,客戶端發送數據,實際是把數據寫入到了 TCP 的緩存中,粘包和半包也就會在此時產生。
客戶端給服務端發送了兩條消息ABC
和DEF
,服務端這邊的接收會有多少種情況呢?有可能是一次性收到了所有的消息ABCDEF
,有可能是收到了三條消息AB
、CD
、EF
。
上面所說的一次性收到了所有的消息ABCDEF
,類似于粘包。如果客戶端發送的包的大小比 TCP 的緩存容量小,并且 TCP 緩存可以存放多個包,那么客戶端和服務端的一次通信就可能傳遞了多個包,這時候服務端從 TCP 緩存就可能一下讀取了多個包,這種現象就叫粘包
。
上面說的后面那種收到了三條消息AB
、CD
、EF
,類似于半包。如果客戶端發送的包的大小比 TCP 的緩存容量大,那么這個數據包就會被分成多個包,通過 Socket 多次發送到服務端,服務端第一次從接受緩存里面獲取的數據,實際是整個包的一部分,這時候就產生了半包
(半包不是說只收到了全包的一半,是說收到了全包的一部分)。
其實從上面的定義,我們就可以大概知道產生的原因了。
粘包的主要原因:
發送方每次寫入數據 < 套接字(Socket)緩沖區大小
接收方讀取套接字(Socket)緩沖區數據不夠及時
半包的主要原因:
發送方每次寫入數據 > 套接字(Socket)緩沖區大小
發送的數據大于協議的 MTU (Maximum Transmission Unit,最大傳輸單元),因此必須拆包
其實我們可以換個角度看待問題:
從收發
的角度看,便是一個發送可能被多次接收,多個發送可能被一次接收。
從傳輸
的角度看,便是一個發送可能占用多個傳輸包,多個發送可能共用一個傳輸包。
根本原因,其實是
TCP 是流式協議,消息無邊界。
(PS :UDP 雖然也可以一次傳輸多個包或者多次傳輸一個包,但每個消息都是有邊界的,因此不會有粘包和半包問題。)
就像上面說的,UDP 之所以不會產生粘包和半包問題,主要是因為消息有邊界,因此,我們也可以采取類似的思路。
將 TCP 連接改成短連接,一個請求一個短連接。這樣的話,建立連接到釋放連接之間的消息即為傳輸的信息,消息也就產生了邊界。
這樣的方法就是十分簡單,不需要在我們的應用中做過多修改。但缺點也就很明顯了,效率低下,TCP 連接和斷開都會涉及三次握手以及四次握手,每個消息都會涉及這些過程,十分浪費性能。
因此,并不推介這種方式。
封裝成幀(Framing),也就是原本發送消息的單位是緩沖大小,現在換成了幀,這樣我們就可以自定義邊界了。一般有4種方式:
這種方式下,消息邊界也就是固定長度即可。
優點就是實現很簡單,缺點就是空間有極大的浪費,如果傳遞的消息中大部分都比較短,這樣就會有很多空間是浪費的。
因此,這種方式一般也是不推介的。
這種方式下,消息邊界也就是分隔符本身。
優點是空間不再浪費,實現也比較簡單。缺點是當內容本身出現分割符時需要轉義,所以無論是發送還是接受,都需要進行整個內容的掃描。
因此,這種方式效率也不是很高,但可以嘗試使用。
這種方式,就有點類似 Http 請求中的 Content-Length,有一個專門的字段存儲消息的長度。作為服務端,接受消息時,先解析固定長度的字段(length字段)獲取消息總長度,然后讀取后續內容。
優點是精確定位用戶數據,內容也不用轉義。缺點是長度理論上有限制,需要提前限制可能的最大長度從而定義長度占用字節數。
因此,十分推介用這種方式。
其他方式就各不相同了,比如 JSON 可以看成是使用{}
是否成對。這些優缺點就需要大家在各自的場景中進行衡量了。
Netty 支持上文所講的封裝成幀(Framing)中的前三種方式,簡單介紹下:
方式 | 解碼 | 編碼 |
---|---|---|
固定長度 | FixedLengthFrameDecoder | 簡單 |
分割符 | DelimiterBasedFrameDecoder | 簡單 |
專門的 length 字段 | LengthFieldBasedFrameDecoder | LengthFieldPrepender |
感謝你能夠認真閱讀完這篇文章,希望小編分享的“Netty中粘包和半包產生原因有哪些”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關注億速云行業資訊頻道,更多相關知識等著你來學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。