中文字幕av专区_日韩电影在线播放_精品国产精品久久一区免费式_av在线免费观看网站

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

hadoop有什么優點

發布時間:2021-12-08 11:18:38 來源:億速云 閱讀:419 作者:小新 欄目:云計算

這篇文章主要為大家展示了“hadoop有什么優點”,內容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“hadoop有什么優點”這篇文章吧。

首先,Hadoop是一個由Apache基金會所開發的分布式系統基礎架構。

Hadoop是一個能夠讓用戶輕松架構和使用的分布式計算平臺。用戶可以輕松地在Hadoop上開發和運行處理海量數據的應用程序。它主要有以下幾個優點:

1.   高可靠性。Hadoop按位存儲和處理數據的能力值得人們信賴。

2.   高擴展性。Hadoop是在可用的計算機集簇間分配數據并完成計算任務的,這些集簇可以方便地擴展到數以千計的節點中。

3.   高效性。Hadoop能夠在節點之間動態地移動數據,并保證各個節點的動態平衡,因此處理速度非常快。

4.   高容錯性。Hadoop能夠自動保存數據的多個副本,并且能夠自動將失敗的任務重新分配。

5.   低成本。與一體機、商用數據倉庫以及QlikView、Yonghong Z-Suite等數據集市相比,hadoop是開源的,項目的軟件成本因此會大大降低。

Hadoop帶有用Java語言編寫的框架,因此運行在 Linux 生產平臺上是非常理想的。

其實我們要知道大數據的實質特性:針對增量中海量的結構化,非結構化,半結構數據,在這種情況下,如何快速反復計算挖掘出高效益的市場數據??帶著這 個問題滲透到業務中去分析,就知道hadoop需要應用到什么業務場景了!!!如果關系型數據庫都能應付的工作還需要hadoop嗎?

關于hadoop,我映像比較深刻的是知乎中有人提到的一個“秒級營銷”,什么是“秒級營銷”呢?說白了就是:

1.通過大數據計算你的個人信息;

2.然后進行精準推送。

hadoop還能夠做什么呢?

例如:

·        大數據量存儲:分布式存儲

·        日志處理: Hadoop擅長這個

·        海量計算: 并行計算

·        ETL:數據抽取到oracle、mysql、DB2、mongdb及主流數據庫

·        使用HBase做數據分析: 用擴展性應對大量的寫操作—Facebook構建了基于HBase的實時數據分析系統

·        搜索引擎:hadoop + lucene實現

·        數據挖掘:目前比較流行的廣告推薦

·        大量地從文件中順序讀。HDFS對順序讀進行了優化,代價是對于隨機的訪問負載較高。

·        任何一臺服務器都有可能失效,需要通過大量的數據復制使得性能不會受到大的影響。

·        個性化廣告推薦

說了這么多,如果沒有理解沒有明白,沒關系。我們挑其核心講唄

Hadoop最核心的設計就是HDFSMapReduce

1.Hdfs提供海量的數據存儲。

具體的可參看HDFS詳解(個人推薦,該博客擁有比較多的文檔支撐)

2.MapReduce提供了對數據的計算。

2.1MapReduce編程模型

MapReduce采用"分而治之"的思想,把對大規模數據集的操作,分發給一個主節點管理下的各個分節點共同完成,然后通過整合各個節點的中間結果,得到最終結果。簡單地說,MapReduce就是"任務的分解與結果的匯總"。

在Hadoop中,用于執行MapReduce任務的機器角色有兩個:一個是JobTracker;另一個是TaskTracker,JobTracker是用于調度工作的,TaskTracker是用于執行工作的。一個Hadoop集群中只有一臺JobTracker。

在分布式計算中,MapReduce框架負責處理了并行編程中分布式存儲、工作調度、負載均衡、容錯均衡、容錯處理以及網絡通信等復雜問題,把處理過程高度抽象為兩個函數:map和reduce,map負責把任務分解成多個任務,reduce負責把分解后多任務處理的結果匯總起來。

需要注意的是,用MapReduce來處理的數據集(或任務)必須具備這樣的特點:待處理的數據集可以分解成許多小的數據集,而且每一個小數據集都可以完全并行地進行處理。

2.2MapReduce處理過程

在Hadoop中,每個MapReduce任務都被初始化為一個Job,每個Job又可以分為兩種階段:map階段和reduce階段。這兩個階段分別用兩個函數表示,即map函數和reduce函數。map函數接收一個<key,value>形式的輸入,然后同樣產生一個<key,value>形式的中間輸出,Hadoop函數接收一個如<key,(list of values)>形式的輸入,然后對這個value集合進行處理,每個reduce產生0或1個輸出,reduce的輸出也是<key,value>形式的。

hadoop有什么優點

MapReduce處理大數據集的過程

以上是“hadoop有什么優點”這篇文章的所有內容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業資訊頻道!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

咸阳市| 蕲春县| 新乡市| 绵阳市| 青龙| 察雅县| 洛隆县| 周宁县| 若羌县| 昆明市| 明水县| 台山市| 扬州市| 泸定县| 苏尼特右旗| 上思县| 容城县| 黑龙江省| 丰原市| 阿巴嘎旗| 乐昌市| 城市| 青海省| 石景山区| 迭部县| 石棉县| 中宁县| 临武县| 岳池县| 泰州市| 积石山| 偏关县| 页游| 泸定县| 汾西县| 会理县| 恩施市| 林州市| 伊宁市| 顺昌县| 麻栗坡县|