在當(dāng)今的大數(shù)據(jù)時(shí)代,以大數(shù)據(jù)分析為基礎(chǔ)的人工智能時(shí)代已經(jīng)到來,各行各業(yè)都基于大數(shù)據(jù)開啟了新時(shí)代,不僅IT行業(yè)需要了解大數(shù)據(jù)知識(shí),而且傳統(tǒng)行業(yè)的從業(yè)者和普通大學(xué)生也應(yīng)了解一些大數(shù)據(jù)知識(shí)。新的基礎(chǔ)架構(gòu)定義未來,大數(shù)據(jù)分析系統(tǒng)技術(shù)將開始得到全面應(yīng)用,大數(shù)據(jù)分析還將重塑整個(gè)產(chǎn)業(yè)結(jié)構(gòu)。想了解大數(shù)據(jù)分析,需要了解它的以下幾個(gè)特點(diǎn):
一、海量的數(shù)據(jù)量
大數(shù)據(jù)分析必然由海量的數(shù)據(jù)量支撐,對(duì)于大數(shù)據(jù)分析而言,有三個(gè)方面的因素定義:容量服務(wù)器數(shù)據(jù)恢復(fù)、許多不同的數(shù)據(jù)和文件類型、對(duì)于管理和更深入的分析數(shù)據(jù)。數(shù)據(jù)量本身就是聚合的概念。不是數(shù)據(jù)量大的數(shù)據(jù)被稱為大數(shù)據(jù),傳統(tǒng)信息系統(tǒng)生成的“小數(shù)據(jù)”也是大數(shù)據(jù)分析的重要組成部分,這點(diǎn)必須清楚。當(dāng)前,從大數(shù)據(jù)的數(shù)據(jù)源的角度來看,它主要集中在互聯(lián)網(wǎng),物聯(lián)網(wǎng)和傳統(tǒng)信息系統(tǒng)三個(gè)渠道。當(dāng)前物聯(lián)網(wǎng)數(shù)據(jù)的比例相對(duì)較大。
二、數(shù)據(jù)分析類型繁多
類型的多樣性也讓大數(shù)據(jù)分析被分為結(jié)構(gòu)化數(shù)據(jù)分析和非結(jié)構(gòu)化數(shù)據(jù)分析,相對(duì)于以往便于存儲(chǔ)的以文本為主的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)越來越多,包括網(wǎng)絡(luò)日志、音頻、視頻還有地理位置信息等,這些多類型的數(shù)據(jù)對(duì)數(shù)據(jù)的處理能力提出了更高要求。
三、數(shù)據(jù)價(jià)值密度
大數(shù)據(jù)分析大時(shí)代,越來越多數(shù)據(jù)都是半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),比如網(wǎng)站訪問日志,里面大量內(nèi)容都是沒價(jià)值的,真正有價(jià)值的比較少,雖然數(shù)據(jù)量比以前大了N倍,但價(jià)值密度確實(shí)低了很多。如果有海量的結(jié)構(gòu)化數(shù)據(jù),則需要靠大數(shù)據(jù)分析才能處理,價(jià)值卻能體現(xiàn)更大化,例如銀聯(lián)的交易數(shù)據(jù),不僅數(shù)據(jù)密度大,價(jià)值也大。
大數(shù)據(jù)分析已經(jīng)成為過去幾年中大部分行業(yè)的游戲規(guī)則,學(xué)者和其他知名的利益相關(guān)者都同意這一點(diǎn),隨著大數(shù)據(jù)分析的服務(wù)商繼續(xù)滲透到我們的日常生活中,圍繞大數(shù)據(jù)的炒作正在轉(zhuǎn)向?qū)嶋H使用中的真正價(jià)值。當(dāng)然大數(shù)據(jù)的出現(xiàn),也讓商業(yè)智能BI逐漸火了起來。
?