日本免费全黄少妇一区二区三区-高清无码一区二区三区四区-欧美中文字幕日韩在线观看-国产福利诱惑在线网站-国产中文字幕一区在线-亚洲欧美精品日韩一区-久久国产精品国产精品国产-国产精久久久久久一区二区三区-欧美亚洲国产精品久久久久

什么是大數(shù)據(jù)史上最全大數(shù)據(jù)理論解析 什么是大數(shù)據(jù)什么是大數(shù)據(jù)技術(shù)( 二 )


四個基本特點如果你在網(wǎng)上搜索大數(shù)據(jù),可能會有一千個專家的一千個定義 。大數(shù)據(jù)的4V特性甚至有5V特性的觀點是最普遍最普遍的特性,就是體量、種類、速度、數(shù)據(jù)價值 。
(1)大量的數(shù)據(jù)
這個特征是最明顯的,也是最基本的特征 。兩個基本條件章節(jié)提到,硬件的發(fā)展和數(shù)據(jù)生產(chǎn)方式的改變,使得數(shù)據(jù)量迅速膨脹 。
(2)種類繁多 。
如今的數(shù)據(jù)已經(jīng)不再局限于數(shù)字 。你寫的一段話,拍的一張照片,錄的一段音頻或視頻,都是大數(shù)據(jù)的組成部分 。這些主要來自我們的視覺和聽覺 。在不久的將來,我們的觸覺、味覺、嗅覺等數(shù)據(jù)也將進入機器采集的范疇,從而形成一個完整的數(shù)據(jù)采集系統(tǒng) 。
(3)高速公路
在大數(shù)據(jù)的背景下,所有的環(huán)節(jié)都變得更快了 。這里的高速不僅指數(shù)據(jù)的生產(chǎn)速度,還包括數(shù)據(jù)的交換速度和處理速度 。比如你在JD.COM商城瀏覽商品,每一次點擊都會以毫秒級的延遲傳到服務(wù)器,服務(wù)器集群會根據(jù)你的動作快速為你推薦新的商品,下一秒就會顯示在你的瀏覽內(nèi)容中 。顯然,如果這個過程太慢,你可能在后臺的數(shù)據(jù)計算完成之前就已經(jīng)關(guān)掉了JD.COM,去了淘寶 。那豈不是會流失客戶?所以,高速也是大數(shù)據(jù)系統(tǒng)一直執(zhí)著追求的目標(biāo) 。
(4)數(shù)據(jù)值
我們有大量的數(shù)據(jù),我們必須期待這些數(shù)據(jù)能給我們帶來一些價值 。顯然,大數(shù)據(jù)是有價值的,但是大數(shù)據(jù)的價值有一個特點——價值密度低 。
比如危險品車間的監(jiān)控攝像頭24小時連續(xù)記錄并回傳數(shù)據(jù),但這些數(shù)據(jù)通常是不變的 。日復(fù)一日的記錄,每隔一段時間就需要刪除,以騰出存儲空間空 。出現(xiàn)異常時,比如視頻中發(fā)現(xiàn)的高溫點,可能是車間有火焰 。此時需要立即調(diào)用消防系統(tǒng)滅火,防止危險發(fā)生 。像這樣有價值的數(shù)據(jù),可能只是攝像頭記錄下來的微小片段,所以數(shù)據(jù)的價值密度較低 。
以上是大數(shù)據(jù)的一些重要特征 。換句話說,符合這些特征的數(shù)據(jù)基本可以認(rèn)為是“大數(shù)據(jù)” 。
五大發(fā)展里程碑萌芽:1980年,大數(shù)據(jù)這個詞是阿爾文·托夫勒在他的新書《第三次浪潮》中提出的 。不僅如此,他還聲稱大數(shù)據(jù)是第三次浪潮的華彩樂章,這就是大數(shù)據(jù)一詞的由來 。阿爾文·托夫勒(Alvin toffler)是著名的未來學(xué)家,他成功預(yù)測了大數(shù)據(jù)的爆發(fā) 。
成長期:2008年9月,《自然》雜志還刊登了一篇封面專欄,名為《大數(shù)據(jù)》 。標(biāo)志著大數(shù)據(jù)的概念已經(jīng)成為舉世公認(rèn)的事實 。在這個階段,大數(shù)據(jù)正式誕生 。在中國的這段時間,以騰訊、網(wǎng)易、新浪、搜狐、百度為代表的主流互聯(lián)網(wǎng)公司,依靠社交、搜索、門戶等產(chǎn)品迅速崛起 。
2004年左右,Google發(fā)表了三篇論文,也就是我們常說的大數(shù)據(jù)三駕馬車:
分布式文件系統(tǒng)GFS,解決了數(shù)據(jù)的底層存儲問題;
MapReduce,大數(shù)據(jù)分布式計算框架,解決數(shù)據(jù)處理和運算問題;
NoSQL數(shù)據(jù)庫系統(tǒng)BigTable解決了數(shù)據(jù)的有序組織問題 。
成熟:一個叫DougCutting的碼農(nóng)開了一家小公司,想做一個超越Google搜索的開源搜索引擎,雖然Google搜索在當(dāng)時基本上是一家獨大的狀態(tài) 。他首先開發(fā)了一個名為Nutch的項目,但是隨著Google發(fā)表的troika論文,他將目標(biāo)轉(zhuǎn)向了實現(xiàn)GFS和MapReduce,并試圖將其集成到他的Nutch項目中 。后來這個模塊被雅虎拿走了,于是Doug Cutting帶著他的項目加入了雅虎,拿著他兒子的一個大象玩具給這個項目命名為Hadoop 。
高潮期:2008年以后,隨著網(wǎng)絡(luò)、存儲、計算等硬件的成熟;智能手機成為移動服務(wù)的標(biāo)準(zhǔn);Hadoop項目不斷成熟 。大量依賴大數(shù)據(jù)的個性化app在這一階段如雨后春筍般出現(xiàn),并迅速成長 。社交網(wǎng)絡(luò)的臉書,云服務(wù)的亞馬遜,內(nèi)容服務(wù)的今日頭條等 。都是這段時間發(fā)展起來的,賺了不少錢 。

推薦閱讀