最近幾年,諸如大數據、云計算、區塊鏈、人工智能……之類的IT新潮詞匯總是隔三差五地刷屏網絡。這些看起來晦澀難懂的IT術語背后代表的是什么?又有什么關聯呢?今天科妹就帶大家對比看看數據倉局、大數據和云計算三者的區別和聯系。
1.數據倉庫:
數據倉庫,是為企業所有級別的決策制定過程,提供所有類型數據支持的戰略集合。它是單個數據存儲,出于分析性報告和決策支持目的而創建。為需要業務智能的企業,提供指導業務流程改進、監視時間、成本、質量以及控制。數據倉庫是決策支持系統(dss)和聯機分析應用數據源的結構化數據環境。數據倉庫研究和解決從數據庫中獲取信息的問題。數據倉庫的特征在于面向主題、集成性、穩定性和時變性。
2.大數據:
大數據(bigdata),指無法在一定時間范圍內用常規軟件工具進行捕捉、管理和處理的數據集合,是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
3.云計算:
云計算(cloudcomputing)是基于互聯網的相關服務的增加、使用和交付模式,通常涉及通過互聯網來提供動態易擴展且經常是虛擬化的資源。云是網絡、互聯網的一種比喻說法。過去在圖中往往用云來表示電信網,后來也用來表示互聯網和底層基礎設施的抽象。因此,云計算甚至可以讓你體驗每秒10萬億次的運算能力,擁有這么強大的計算能力可以模擬核爆炸、預測氣候變化和市場發展趨勢。用戶通過電腦、筆記本、手機等方式接入數據中心,按自己的需求進行運算。
1、數據庫和數據倉庫都是數據的一種存儲方式,大數據處理更多的是一種需求(問題),而云計算是一種比較綜合的需求(問題)解決方案。
2、由于云計算本身的特性,天生就面臨大數據處理(存儲、計算等)問題,因為云計算的基本架構模式是C/S模式,其中S相對集中,而C是廣泛分布。所有用戶的數據和絕大部分的計算都是在S端完成的(數據量大,計算量大),加上用戶也天然具有多樣性(地域,文化,需求,個性化等),因此需求(也包括計算量)就非常大。
3、云計算當然會涉及到數據的存儲技術,但數據庫技術對于云計算來說要視具體的情況來分析:
A)對于IaaS而言,數據庫技術不是必需的,也不是必備的功能;
B)對于PaaS來說,數據庫功能應該是必備的功能
C)對于SaaS而言,必然會用到數據庫技術(包括傳統關系數據庫和NoSQL數據庫)。
而對于數據倉庫技術,并不是云計算所必需的,但由于云數據的信息價值極大,類似一座金礦,我想云服務商是不可能放過從這些金礦中提取金子的。
4、大數據首先所面臨的問題就是大數據的存儲問題,一般都會綜合運用各種存儲技術(文件存儲,數據庫存儲),當然,你完全用文件存儲或者數據庫存儲來解決,也是沒問題的。與云計算類似,數據倉庫技術不是必需的,但對于數據倉庫技術對于結構化數據進行淘金還是非常有用的,當然,你不用數據倉庫技術也可以,比如Hadoop模式。在云計算和大數據處理中,最基礎的技術其實是分布式計算技術。而對于構建分布式計算而言,多線程,同步,遠程調用(RPC,RMI等),進程管理與通信是其基本技術點。分布式計算編程是一種綜合性應用編程,不僅需要有基本的技術點,還需要一定的組織管理知識。
大數據、數據倉庫和云計算的關聯和區別你已經理解了多少了呢?更多的大數據相關資訊關注微信公眾號成都科多大數據就能獲取哦。
評論