JanWong,粘包

怎么解決TCP網絡傳輸「粘包」問題?
【JanWong,粘包】

JanWong,粘包


TCP粘包是指發送方發送的多個數據包到接收方后粘連在一起 , 導致數據包不能完整的提現發送的數據 。TCP協議TCP是一個面向連接的傳輸層協議 , 不屬于ISO制定的協議集 。TCP協議在商業界和工業界的成功應用 , 使它成為事實上的網絡標準 , 廣泛應用于各種網絡主機間的通信 。TCP目標是為用戶提供可靠的端到端連接 , 保證信息有序無誤的傳輸 。
TCP為確??煽啃圆捎昧藬祿幪枴⑿r灪陀嬎?、數據確認等一系列措施 。TCP對傳送的每個數據字節都進行編號 , 并請求接收方回傳確認信息(ACK) 。發送方如果在規定的時間內沒有收到數據確認 , 就重傳該數據 。數據編號使接收方能夠處理數據的失序和重復問題 。數據誤碼問題通過在每個傳輸的數據段中增加校驗和予以解決 , 接收方在接收到數據后檢查校驗和 , 若校驗和有誤 , 則丟棄該有誤碼的數據段 , 并要求發送方重傳 。
流量控制也是保證可靠性的一個重要措施 , 若無流控 , 可能會因接收緩沖區溢出而丟失大量數據 , 導致許多重傳 , 造成網絡擁塞惡性循環 。TCP采用可變窗口進行流量控制 , 由接收方控制發送方發送的數據量 。這些可靠性保障措施為用戶提供了高可靠性的網絡傳輸服務 , 但也影響了傳輸效率 。在實際工程應用中 , 只有關鍵數據的傳輸才采用TCP , 而普通數據的傳輸一般采用高效率的UDP 。
UDP不會出現粘包問題 。UDP支持的是一對多的模式 , 不會使用塊的合并優化算法 , 所以接收端的skbuff(套接字緩沖區)采用了鏈式結構來記錄每一個到達的UDP包 , 在每個UDP包中就有了消息頭(包含消息來源地址 , 端口等信息) , 接收端很容易就能進行區分處理了 。粘包出現原因出現粘包現象的原因有很多方面 , 它既可能由發送方造成的 , 也可能是由接收方造成的 。
發送方原因TCP需要盡可能高效和可靠 , 默認采用Nagle算法 , 發送方往往要收集到足夠多的數據后合并相連的小數據包 , 才發送一包數據 , 這樣接收方就收到了粘包數據 。但接收方并不知曉發送方合并數據包 , 并數據包的合并在TCP協議中是沒有分界線的 , 就會導致接收方不能還原其本來的數據包 。接收方原因TCP是基于“流”的 。
網絡傳輸數據的速度可能會快過接收方處理數據的速度 , 這時候就會導致 , 接收方在讀取緩沖區時 , 緩沖區存在多個數據包 。在TCP協議中接收方是一次讀取緩沖區中的所有內容 , 就不能反映原本的數據信息 。粘包情況有兩種:一種是粘在一起的包都是完整的數據包;一種是粘在一起的包有不完整的包;不是所有的粘包現象都需要處理如果傳輸的數據為不帶結構的連續流數據(如文件傳輸) , 就不必把粘連的包分開(簡稱分包) 。
但實際工程應用中一般為帶結構的數據 , 這時就需要做分包處理 。在處理定長結構數據的粘包問題時 , 分包算法比較簡單;在處理不定長結構數據的粘包問題時 , 分包算法就比較復雜 。特別是粘在一起的包有不完整的包的粘包情況 , 一包數據內容被分在了兩個連續的接收包中 , 處理起來難度較大 。實際工程應用中應盡量避免出現粘包現象 。為了避免粘包現象 , 可采取以下幾種措施:(1)發送方引起的粘包可通過編程設置來避免 。

推薦閱讀