您好,登錄后才能下訂單哦!
現在說起大數據,那是相當火的“時髦詞”,大家在炒概念,大數據并不難,怎樣利用大數據還是很難得,在我看來,目前很多人都在吹噓大數據。但是真正懂大數據的人卻寥寥無幾,下面我們來聊聊大數據概念:
大數據(big data),簡單來說就是巨量數據集合(IT行業術語),百度百科詞條的解釋是這樣的:指無法在可承受的時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。
在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中是這樣定義大數據的:指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。大數據的5V特點(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)Veracity(真實性)。
大數據是需要更新模式才能具有更強大的決策力,洞察發現力和流程優化能力來適應海量,高增長和多樣化的信息資產。大數據有以下幾點內涵吧:
1. 數據量大,TB,PB,乃至EB等數據量的數據需要分析處理。
2. 要求快速響應,市場變化快,要求能及時快速的響應變化,對數據的分析也要快,在性能上有更高要求,所以數據量顯得對速度要求有些“大”。
3. 數據多樣性:不同的數據源,非結構化數據越來越多,需要進行清洗,整理,篩選等操作,變為結構數據。
4. 價值密度低,由于數據采集的不及時,數據樣本不全面,數據可能不連續等等,數據可能會失真,但當數據量達到一定規模,可以通過更多的數據達到更真實全面的反饋。
現在的社會是一個快速發展的時代,科技發達,信息流通,人們之家的交流越來越密切呢,生活也是越來越方便,大數據就是這個高科技時代的產物;很多行業都會有大數據需求,譬如電信行業,互聯網行業等等容易產生大量數據的行業,很多傳統行業,譬如醫藥,教育,采礦,電力等等任何行業,都會有大數據需求。大數據與各個行業的深度融會,將發生出前所未有的社會和商業價值。
馬云曾說過,未來時代將不是IT時代,而是DT(Data Technology數據科技)的時代,顯示大數據對于阿里巴巴企業來說舉足輕重。
這是本人理解的大數據概念, 如果有不對的地方,希望諒解,也希望你們多多補充,讓我們感受和期待大數據未來的發展
本文出自檸檬派(http://www.lemonpai.com/1419.html 在Apache Hive中輕松生存的12個技巧 )轉載請務必保留此出處 ,否則將追究法律責任!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。