產品推薦

向日葵安卓app下载Preciset機房空調
向日葵安卓版免费下载appPrecise係列專為中小型機房設計的機房專用空調Precise...【詳細】
MPS 10-100 kVA UPS
MPS係列UPS設備確保任何類型的負載,最大限度的保護和電能質...【詳細】

聯係向日葵安卓版免费下载app

服務熱線
010-62104284

地址:北京市海澱區知春路豪景大廈B座十層
魯文: 13520099504
Q Q:514468705/1049705527
郵箱:jhcxkj@163.com

首頁 > 新聞中心 > 簡述Hadoop之後大數據的未來在誰的身上

簡述Hadoop之後大數據的未來在誰的身上

雙擊自動滾屏 發布者:精密空調 發布時間:2019-08-07 08:49:48 閱讀:次【字體:

在實時數據世界裏,為什麽向日葵安卓版免费下载還這麽執著於Hadoop? 根據451 Research調查數據顯示,圍繞批處理架構的Hadoop仍然是大數據的代表技術,盡管其聲譽仍然超過實際部署情況。下麵向日葵安卓app下载來具體了解一下。

批處理不是重點

Cloudera的Doug Cutting是一個非常聰明的人,也是開源開發人員,Hadoop、Lucene等大數據工具的開發都有他的功勞。

雖然Cutting承認實時流媒體技術的重要性,但他並沒有否認麵向批處理的Hadoop的價值,他表示:

並不是因為向日葵安卓版免费下载覺得批處理是最好的,所以Hadoop圍繞批處理而構建。批處理(特別是MapReduce)很自然是第一步,因為它相對容易部署,並提供很重要的價值。在Hadoop之前,沒有辦法使用開源軟件在商品硬件存儲和處理千兆字節。Hadoop的MapReduce是很大的進步。

向日葵安卓安装下载很難說清楚大數據的商品化對這個世界的重要性。這並不是說在Hadoop之前向日葵安卓安装下载沒有存儲和分析大量數據,而是Hadoop讓向日葵安卓app下载非常廉價地實現這個過程。

總之,Hadoop民主化了大數據。 轉向流數據? 然而,Hadoop並沒有讓大數據分析變得容易。正如DataStax首席布道者Patrick McFadin表示,從企業數據挖掘價值並沒有那麽簡單:

向日葵安卓安装下载都聽說過存儲和分析PB級數據的投資回報率的問題。穀歌、雅虎和Facebook都在從中創造驚人的價值,而大部分企業都在試圖研究如何分析所有數據,第一:收集所有數據;第二:……第三:利潤! 在數據收集和利潤之間有很多麻煩的步驟。隨著企業試圖加快對實時數據的分析能力,新技術為他們提供了可能。

McFadin發現了這個新大數據堆棧的關鍵要素。首先是一個排隊係統,Kafka、RabbitMQ和Kinesis等。然後是流處理層,這可能包括Storm、Spark Streaming或者Samza。對於高速存儲,企業經常轉向Cassandra、HBase、MongoDB或者MySQL等關係型數據庫。

最有趣的是批處理仍然有用武之地。McFadin表示,批處理現在可用於處理,即匯總和更深入的分析。批處理和實時的融合被稱為"Lambda架構",這涉及讓三個元素和諧地共處:批處理、速度和服務。

換句話說,批處理仍然有用。

淘汰批處理

但並不是每個人都同意。Zoomdata公司首席執行官和聯合創始人Justin Langseth認為Lambda是"不必要的",並稱,"現在有端到端工具可以從采購、運輸、存儲到分析和可視化來處理數據,而不需要批處理"。

在他看來,批處理是大數據過去的遺留物:

實時數據顯然最好應該作為流來處理,而且還可以加載曆史數據,正如你的DVR可以加載電影《飄》或者上周的電視節目《美國偶像》到你的電視。這種區別很重要,Zoomdata認為將數據作為流來分析可以增加可擴展性和靈活性,而無論數據是實時還是曆史數據。

然而,超越可擴展性和靈活性好處的可能是將批處理從大數據過程移除所帶來的簡單性。Langseth認為,"當你不需要擔心批處理窗口以及從批處理故障中恢複時,這可以極大地簡化大數據架構。"

流分析取代Hadoop?

Cutting稱,還沒有那麽快。

Cutting認為未來Hadoop等技術並不會完全被淘汰,流分析會得以發展,Cloudera的Enterprise Data Hub也是一樣。事實上,他不認為會廣泛轉向流分析,而是為大家帶來了又一種選擇。 更有趣的是,大數據的大爆炸會讓行業催生出一些好方法來應對數據處理。

我認為向日葵安卓安装下载不會再那麽頻繁地看到Spark這樣的主要技術增加,隨著時間的推移,向日葵安卓版免费下载app將會標準化這些工具,為大多數人提供功能來滿足其大數據應用需求。Hadoop帶來了技術爆炸,但向日葵安卓版免费下载可能會進入比較正常的演化過程,在各行業廣泛使用這些技術。

DataStax社區經理Scott Hirleman同意說:"批處理並不會消失,總是會需要對大量數據的大規模分析。"現在大家對流分析有極大的興趣,但稱現在還不清楚這種趨勢對大數據計劃的影響。

總之,流分析完全是關於"和",而不是"或者",這是對圍繞批處理係統(例如Hadoop)的很好的補充,但這肯定不會完全取代Hadoop。

來源:精密空調 http://www.cubicleflood.com

在線谘詢 電話谘詢