作為一名數(shù)據(jù)分析師或者想要轉(zhuǎn)行從事數(shù)據(jù)分析的人員,在用bi工具做
數(shù)據(jù)分析時,以下幾個概念是一定要知道的:數(shù)據(jù)庫、數(shù)據(jù)倉庫和數(shù)據(jù)中臺,下面我們就做展開做詳細介紹:
數(shù)據(jù)庫的概念
數(shù)據(jù)庫是一種邏輯概念,用來存放數(shù)據(jù)的倉庫,通過數(shù)據(jù)庫軟件來實現(xiàn)。數(shù)據(jù)庫由很多表組成,表是二維的,一張表里面有很多字段。字段一字排開,對數(shù)據(jù)就一行一行的寫入表中。數(shù)據(jù)庫的表,在于能夠用二維表現(xiàn)多維的關(guān)系。如:oracle、DB2、MySQL、Sybase、MSSQL Server等。
用永洪bi做數(shù)據(jù)分析怎么操作數(shù)據(jù)庫?
實際上用bi工具做數(shù)據(jù)分析時,只要簡單的在bi工具中做數(shù)據(jù)配置就可以了。由于很多bi工具廠商像永洪bi都支持很多類型的數(shù)據(jù)庫連接,點擊需要連接的數(shù)據(jù)庫類型SAP HANA,在URL輸入該數(shù)據(jù)庫所在站點地址,用戶名及密碼,永洪bi即可自動連接數(shù)據(jù)庫。
數(shù)據(jù)倉庫的概念
是數(shù)據(jù)庫概念的升級。從邏輯上理解,數(shù)據(jù)庫和數(shù)據(jù)倉庫沒有區(qū)別,都是通過數(shù)據(jù)庫軟件實現(xiàn)存放數(shù)據(jù)的地方,只不過從數(shù)據(jù)量來說,數(shù)據(jù)倉庫要比數(shù)據(jù)庫更龐大德多。數(shù)據(jù)倉庫主要用于數(shù)據(jù)挖掘和數(shù)據(jù)分析,輔助領導做決策。
數(shù)據(jù)庫和數(shù)據(jù)倉庫的區(qū)別
區(qū)別主要總結(jié)為以下幾點:
1.數(shù)據(jù)庫只存放當前值,數(shù)據(jù)倉庫存放歷史值;
2.數(shù)據(jù)庫內(nèi)數(shù)據(jù)是動態(tài)變化的,只要有業(yè)務發(fā)生,數(shù)據(jù)就會被更新,而數(shù)據(jù)倉庫則是靜態(tài)的歷史數(shù)據(jù),只能定期添加、刷新;
3.數(shù)據(jù)庫中的數(shù)據(jù)結(jié)構(gòu)比較復雜,有各種結(jié)構(gòu)以適合業(yè)務處理系統(tǒng)的需要,而數(shù)據(jù)倉庫中的數(shù)據(jù)結(jié)構(gòu)則相對簡單;
4.數(shù)據(jù)庫中數(shù)據(jù)訪問頻率較高,但訪問量較少,而數(shù)據(jù)倉庫的訪問頻率低但訪問量卻很高;
5.數(shù)據(jù)庫中數(shù)據(jù)的目標是面向業(yè)務處理人員的,為業(yè)務處理人員提供信息處理的支持,而數(shù)據(jù)倉庫則是面向高層管理人員的,為其提供決策支持;
6.數(shù)據(jù)庫在訪問數(shù)據(jù)時要求響應速度快,其響應時間一般在幾秒內(nèi),而數(shù)據(jù)倉庫的響應時間則可長達數(shù)幾小時
數(shù)據(jù)中臺的概念
數(shù)據(jù)中臺是指通過數(shù)據(jù)技術(shù),對海量數(shù)據(jù)進行采集、計算、存儲、加工,同時統(tǒng)一標準和口徑。數(shù)據(jù)中臺把數(shù)據(jù)統(tǒng)一之后,會形成標準數(shù)據(jù),再進行存儲,形成大數(shù)據(jù)資產(chǎn)層,進而為客戶提供高效服務。
數(shù)據(jù)中臺負責全域數(shù)據(jù)采集、數(shù)據(jù)資產(chǎn)加工和管理、并向前臺業(yè)務部門和決策部門提供數(shù)據(jù)服務的所以數(shù)據(jù)中臺的核心應該是數(shù)據(jù)資產(chǎn)管理和數(shù)據(jù)賦能。通俗的講就是數(shù)據(jù)彈藥庫。
bi與數(shù)據(jù)倉庫和數(shù)據(jù)中臺的關(guān)系
很多人問在構(gòu)建bi系統(tǒng)時需不需要搭建數(shù)據(jù)倉庫,其實這兩者是非必須的關(guān)系。對于小型企業(yè)來說,數(shù)據(jù)量小的基礎上,可以直接利用bi工具進行數(shù)據(jù)分析,而大企業(yè)由于數(shù)據(jù)量的繁多,需要在此基礎上搭建數(shù)據(jù)倉庫,提升數(shù)據(jù)分析效率。bi和數(shù)據(jù)中臺直接則完全是互不想干的,從上面數(shù)據(jù)倉庫的概念我們知道數(shù)據(jù)中臺是基于企業(yè)業(yè)務場景為數(shù)據(jù)倉庫提供標準數(shù)據(jù)口徑來源的,與bi的搭建沒有太大的關(guān)系。
?