作者: 永洪BI??來(lái)源: 永洪科技??時(shí)間:2020年01月09日
現(xiàn)在的報(bào)告樣式多種多樣,越來(lái)越炫酷以至于讓人應(yīng)接不暇。如果想從數(shù)據(jù)結(jié)果上進(jìn)行溯源,由于數(shù)據(jù)處理過(guò)程盤(pán)根錯(cuò)節(jié)且技術(shù)性過(guò)強(qiáng),讓業(yè)務(wù)人員捉襟見(jiàn)肘。如何讓業(yè)務(wù)人員清晰可視化的看到數(shù)據(jù)從來(lái)源、加工到展示的一步步操作,永洪科技為您排憂解難。
今天這篇文章,主要介紹永洪自服務(wù)數(shù)據(jù)查詢,這種方式提供強(qiáng)大、便捷的數(shù)據(jù)準(zhǔn)備和整合方式,用戶可以通過(guò)在圖形化界面上只需要進(jìn)行簡(jiǎn)單的拖拽和可視化的操作,便可以構(gòu)建復(fù)雜的數(shù)據(jù)集。
數(shù)據(jù)準(zhǔn)備過(guò)程主要涉及三類(lèi)功能節(jié)點(diǎn):輸入節(jié)點(diǎn)(用于實(shí)現(xiàn)數(shù)據(jù)庫(kù)表連接、導(dǎo)入EXCEL數(shù)據(jù)、創(chuàng)建內(nèi)嵌數(shù)據(jù))、中間節(jié)點(diǎn) (對(duì)輸入節(jié)點(diǎn)進(jìn)行關(guān)聯(lián)和數(shù)據(jù)操作的節(jié)點(diǎn))及查詢結(jié)果節(jié)點(diǎn)。
輸入節(jié)點(diǎn)
輸入節(jié)點(diǎn)即數(shù)據(jù)源入口節(jié)點(diǎn)??梢酝ㄟ^(guò)連接數(shù)據(jù)庫(kù)表、導(dǎo)入Excel、創(chuàng)建內(nèi)嵌數(shù)據(jù)方式,將來(lái)自不同類(lèi)型的查詢數(shù)據(jù)作為自服務(wù)數(shù)據(jù)操作的輸入節(jié)點(diǎn)。
關(guān)聯(lián)&轉(zhuǎn)換節(jié)點(diǎn)
操作功能區(qū)中系統(tǒng)內(nèi)嵌了關(guān)聯(lián)(聯(lián)接、聯(lián)合)和轉(zhuǎn)換(逆透視表、分組和匯總、自循環(huán)列、鏡像、去重)兩類(lèi)數(shù)據(jù)處理節(jié)點(diǎn)。
1、關(guān)聯(lián)節(jié)點(diǎn)-聯(lián)接 (Join)
通過(guò)聯(lián)接節(jié)點(diǎn)將數(shù)據(jù)表與表之間按既定連接類(lèi)型進(jìn)行關(guān)聯(lián)、數(shù)據(jù)整合。如果數(shù)據(jù)庫(kù)表之間定義了外聯(lián)接信息,聯(lián)接節(jié)點(diǎn)會(huì)基于這些外聯(lián)接信息將缺省的聯(lián)接做好。
2、關(guān)聯(lián)節(jié)點(diǎn)-聯(lián)合 (Union All)
通過(guò)連線的方式,聯(lián)合節(jié)點(diǎn)可以將列數(shù)相同的表的數(shù)據(jù) (包括重復(fù)數(shù)據(jù)行)拼接在一起。
舉例:A表包括1日到20日的交易信息,B表包括21日到30日的交易信息,現(xiàn)通過(guò)聯(lián)合節(jié)點(diǎn)將兩表數(shù)據(jù)整合到一起,從而能夠查看到1日到30日的全周期交易信息。
3、轉(zhuǎn)換-逆透視表 (Unpivot Table)
逆透視表節(jié)點(diǎn)是將多維轉(zhuǎn)為一維的一種數(shù)據(jù)處理操作。
舉例:如下圖同一用戶有數(shù)學(xué)、語(yǔ)文、英語(yǔ)三類(lèi)不同科目成績(jī),現(xiàn)需通過(guò)數(shù)據(jù)處理對(duì)各科成績(jī)整合到單列中形成新數(shù)據(jù)集,便于進(jìn)行每位同學(xué)的匯總成績(jī)分析。
在逆透視節(jié)點(diǎn)中,設(shè)置數(shù)據(jù)保持不變列為保留列和需要從多維轉(zhuǎn)一維的列為轉(zhuǎn)換列。
即可應(yīng)用該數(shù)據(jù)集按班級(jí)、人員進(jìn)行各科成績(jī)的匯總分析,轉(zhuǎn)換結(jié)果如下圖所示。
4、分組和匯總 ( Aggregate)
分組和匯總即對(duì)數(shù)據(jù)進(jìn)行分組聚合。
舉例:在上例的基礎(chǔ)上,現(xiàn)對(duì)每位同學(xué)的成績(jī)進(jìn)行分組,并匯總每位同學(xué)的總成績(jī)。
5、自循環(huán)列 ( Autoloop)
自循環(huán)列就是根據(jù)設(shè)置自動(dòng)分出層級(jí)關(guān)系的列,每個(gè)查詢只能創(chuàng)建一個(gè)自循環(huán)列。
通常我們會(huì)遇到一列中數(shù)據(jù)存在層級(jí)關(guān)系,如河北省、石家莊、正定縣,三個(gè)區(qū)域存在所屬關(guān)系,在區(qū)域ID上也存在父子級(jí)關(guān)系。通過(guò)自循環(huán)列操作可實(shí)現(xiàn)各個(gè)區(qū)域的層級(jí)劃分。
6、鏡像
通過(guò)連線鏡像節(jié)點(diǎn),任意節(jié)點(diǎn)可以被復(fù)制一個(gè)或多個(gè),在需要對(duì)同一輸入節(jié)點(diǎn)并行進(jìn)行多種數(shù)據(jù)處理的場(chǎng)景下應(yīng)用。
7、去重
通過(guò)連線的方式,去重節(jié)點(diǎn)可以把連線節(jié)點(diǎn)的重復(fù)記錄去掉。
舉例:A表中用戶1和用戶數(shù)據(jù)2存在重復(fù)數(shù)據(jù),現(xiàn)對(duì)其進(jìn)行去重,原數(shù)據(jù)如下。
連接去重節(jié)點(diǎn)之后重復(fù)記錄被去掉。
查詢結(jié)果節(jié)點(diǎn)
查詢結(jié)果節(jié)點(diǎn)是所有節(jié)點(diǎn)數(shù)據(jù)處理的終結(jié)點(diǎn),查詢結(jié)果節(jié)點(diǎn)只能有一個(gè)輸入??赏ㄟ^(guò)操作查詢結(jié)果節(jié)點(diǎn)將自服務(wù)數(shù)據(jù)集導(dǎo)入數(shù)據(jù)庫(kù)。
實(shí)時(shí)性能檢測(cè)
自服務(wù)數(shù)據(jù)準(zhǔn)備中,數(shù)據(jù)執(zhí)行的絕對(duì)快慢很難得知,可以通過(guò)連線的顏色進(jìn)行實(shí)時(shí)性能檢測(cè),連線顏色為綠色時(shí)表示性能快,連線為黃色時(shí)表示性能慢,用戶可以根據(jù)性能快慢進(jìn)行性能調(diào)優(yōu)。
如圖則性能一般,需要進(jìn)一步調(diào)優(yōu)。在調(diào)整后可以點(diǎn)擊畫(huà)布左上角性能檢測(cè),小球會(huì)沿著輸入節(jié)點(diǎn)的軌跡,開(kāi)始滾動(dòng),在查詢結(jié)果節(jié)點(diǎn)停止,小球的顏色跟連線的顏色相同反應(yīng)性能。
自動(dòng)布局
自動(dòng)布局功能為用戶提供了節(jié)點(diǎn)和節(jié)點(diǎn)之間根據(jù)既定算法優(yōu)化布局,讓布局更加合理美觀。
自動(dòng)布局前:
自動(dòng)布局后:
在自服務(wù)查詢中,用戶通過(guò)可視化的工作流方式,直接利用已建好的查詢對(duì)數(shù)據(jù)進(jìn)行輕度建模與轉(zhuǎn)換,同時(shí)也可以將外部多種數(shù)據(jù)源直接引入進(jìn)行數(shù)據(jù)建模及轉(zhuǎn)換。自服務(wù)查詢不僅僅提供對(duì)數(shù)據(jù)進(jìn)行分組與匯總、逆透視表轉(zhuǎn)化等轉(zhuǎn)變數(shù)據(jù)結(jié)構(gòu)的功能,同時(shí)新增加多種數(shù)據(jù)轉(zhuǎn)換功能如:值映射、去除空格、去除重復(fù)記錄、缺失值替換、拆分列為多列、創(chuàng)建組等。
自服務(wù)查詢可以使得用戶操作過(guò)程更流暢,全視圖化界面方便用戶對(duì)數(shù)據(jù)結(jié)構(gòu)及細(xì)節(jié)進(jìn)行查看了解。通過(guò)連線顏色及提示信息,實(shí)時(shí)友好的展示各數(shù)據(jù)節(jié)點(diǎn)的性能指標(biāo),并將展示數(shù)據(jù)模型的整體性能狀態(tài)及時(shí)通告給用戶。
?