大數據,是由數量巨大、結構復雜、類型眾多數據構成的數據集合,是基于云計算的數據處理與應用模式,通過數據的集成共享,交叉復用形成的智力資源和知識服務能力。
有研究機構如此定義“大數據”:“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。從某種程度上說,大數據是數據分析的前沿技術。簡言之,從各種各樣類型的數據中,快速獲得有價值信息的能力,就是大數據技術。
大數據從何而來
美國互聯網數據中心指出,互聯網上的數據每年將增長50%,每兩年便將翻一番,目前世界上90%以上的數據是最近幾年才產生的。此外,全世界的工業設備、汽車、電表上有著無數的數碼傳感器,隨時測量和傳遞著有關位置、運動、震動、溫度、濕度乃至空氣中化學物質的變化,也產生了海量的數據信息。
物聯網、云計算、移動互聯網、車聯網、手機、平板電腦、PC以及各種各樣的傳感器,無一不是數據來源或者承載的方式。

大數據最核心的價值就是在于對于海量數據進行存儲和分析。相比起現有的其他技術而言,大數據的“廉價、迅速、優化”這三方面的綜合成本是最優的。