2 回答

TA貢獻(xiàn)1862條經(jīng)驗(yàn) 獲得超6個(gè)贊
大數(shù)據(jù)(big data),是指無(wú)法在可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行捕捉、管理和處理的數(shù)據(jù)集合。它的4個(gè)基本特征分別為:
1. 數(shù)據(jù)量大,TB,PB,乃至EB等數(shù)據(jù)量的數(shù)據(jù)需要分析處理。
2. 要求快速響應(yīng),市場(chǎng)變化快,要求能及時(shí)快速的響應(yīng)變化,那對(duì)數(shù)據(jù)的分析也要快速,在性能上有更高要求,所以數(shù)據(jù)量顯得對(duì)速度要求有些“大”。
3. 數(shù)據(jù)多樣性:不同的數(shù)據(jù)源,非結(jié)構(gòu)化數(shù)據(jù)越來(lái)越多,需要進(jìn)行清洗,整理,篩選等操作,變?yōu)榻Y(jié)構(gòu)數(shù)據(jù)。
4. 價(jià)值密度低,由于數(shù)據(jù)采集的不及時(shí),數(shù)據(jù)樣本不全面,數(shù)據(jù)可能不連續(xù)等等,數(shù)據(jù)可能會(huì)失真,但當(dāng)數(shù)據(jù)量達(dá)到一定規(guī)模,可以通過(guò)更多的數(shù)據(jù)達(dá)到更真實(shí)全面的反饋。
添加回答
舉報(bào)