您好,登錄后才能下訂單哦!
這篇文章主要講解了“hadoop2.2中序列化的原理是什么 ”,文中的講解內容簡單清晰,易于學習與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學習“hadoop2.2中序列化的原理是什么 ”吧!
序列化是指將一個對象編碼成字節流,之后從字節流中重構對象;
為什么需要序列化?
答:用序列化接口可以將對象實例從存儲到本地文件或者傳送到網絡的另一端的節點上;
序列化過程:
序列化的三種主要用途:
1.作為一種持久化的格式
2. 一種網絡節點間通信的數據格式
3. 拷貝和克隆
hadoop的序列化機制:
調用write()方法將對象序列化到流中,調用readFile()方法進行反序列化;
java序列化和hadoop序列化的主要區別:
java序列化后的對象不能復用,故在反序列化過程中不斷創建新對象
hadoop序列化后的對象可以復用,故反序列化過程中可以復用對象,可以得到一個序列化后的對象的多個反序列化后的結果
hadoop的序列化機制減少了對java對象的分配和回收,提高了應用效率;
hadoop序列化機制的優勢:
1.緊湊:Hadoop中最稀缺的資源是寬帶,所以緊湊的序列化機制可以充分的利用寬帶。
2.快速:通信時大量使用序列化機制,因此,需要減少序列化和反序列化的開銷。
3.可擴展:隨著通信協議的升級而可升級。
4.互操作:支持不同開發語言的通信。
Hadoop 序列化機制:
Hadoop通過Writable接口實現的序列化機制。
接口提供兩個方法,write和readFiles。
Hadoop還包含另外幾個重要的序列化接口,WritableCompareable、RawComparator、WritableComparator。
感謝各位的閱讀,以上就是“hadoop2.2中序列化的原理是什么 ”的內容了,經過本文的學習后,相信大家對hadoop2.2中序列化的原理是什么 這一問題有了更深刻的體會,具體使用情況還需要大家實踐驗證。這里是億速云,小編將為大家推送更多相關知識點的文章,歡迎關注!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。