您好,登錄后才能下訂單哦!
發現最近很多人關注CDH版本更新的問題,CDH6更新有一年多的時間了,2019年2月19日,迭代的版本為CDH6.1.1,現在CDH最新的版本已經到CDH6.3.3了。為了方便比較,本文內容主要基于CDH5.16.1和CDH6.1.1進行說明。CDH6是基于Hadoop3同時包含大量其他組件的大版本更新的發布版本,許多用戶考慮到未來CDH的版本主要是基于CDH6,而CDH5會慢慢的停止更新,所以考慮新搭集群使用CDH6,或者想把已有的CDH5集群升級到CDH6第一個問題就是需要考慮CDH5和CDH6的差別,通過分析一些差異看能否將已有的應用遷移或者直接部署到CDH6,兼容性穩定性是否存在問題等。出于這個目的,本文會大概概括一下兩個版本間的差異,如果你需要更詳細的從各個方面比較CDH5和CDH6的差別的文檔,可以給我留言,我會發你。然后需要強調一下:沒有最好的技術,也不是說最新的技術就是最好的,永遠只有最合適的技術。
CDH6相對于CDH5是一次各個組件的大版本升級,要理解大版本更新,這里先解釋一下Hadoop相關組件的版本說明。比如版本號是x.y.z,z代表的一般是Maintenance Version或Patch Version,這種版本升級主要修復bug,不改動API,也不涉及新的功能,y代表的是Minor Version,這種版本升級主要是增加新的功能和新的API,x代表的是Major Version,往往會新增全新的功能,甚至改動API。那么CDH5到CDH6就是一次Major Version的升級,新增了很多功能,API的更改有可能導致你舊有的程序的不兼容而需要修改或者重新開發,但根據軟件開發迭代的原則,往往新版本會向下兼容一段時間,你只需要經過嚴格的測試,在一段時間內應用開發的修改理論不會太大,但還是要結合實際情況,進行嚴格的測試后再行判斷和評估。
CDH5現在依舊是市場上用的最多,推得最廣的版本,客戶認可度也較高。同時,CDH5經過快5年的迭代也是目前最成熟和穩定的版本,各個組件跟隨著社區版的更新迭代,已經把各個組件的bug修復得很完善。另外,無論是國外還是國內支持案例也多,國內可以找到很多相關的實施案例供參考,可以節省運維人力、物力成本。最后CDH5的周邊生態圈支持也比較豐富,無論是開源還是商業產品,ETL工具,調度工具,報表工具,BI工具等。你如果現在選擇CDH5或者已經在用了,Cloudera也官宣了依舊會再支持三年。
CDH6的更新較大,很多組件也都是大版本更新,引入了很多激動人心的新功能,同時各個組件也修復了大量已知的問題和安全漏洞。比如HDFS的糾刪碼用于冷數據降低存儲成本又保證了數據的可用性,NameNode和YARN的聯邦解決大規模集群的性能瓶頸問題,YARN引入GPU支持,未來會引入docker支持等。長遠來看,從Hadoop2升級到Hadoop3或者從CDH5升級到CDH6是必須的,因為無論是社區還是Cloudera從現在開始開始都會將開發重心轉移到Hadoop3或CDH6上,而CDH5則主要以維護和修復bug為主。
建議:
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。