免费视频淫片aa毛片_日韩高清在线亚洲专区vr_日韩大片免费观看视频播放_亚洲欧美国产精品完整版

打開APP
userphoto
未登錄

開通VIP,暢享免費電子書等14項超值服

開通VIP
維度模型數(shù)據(jù)倉庫基礎對象概念一覽

一、度量、指標、指標器

度量和維度構成OLAP的主要概念,對于在事實表或者一個多維立方體里面存放的數(shù)值型的、連續(xù)的字段,就是度量。這符合上面的意思,有標準。一個度量字段肯定是統(tǒng)一單位,比如元、戶數(shù)。假設一個度量字段。當中的度量值可能是歐元又有可能是美元,那這個度量沒法匯總。

OLAP中還有計算度量的說法,用一個總費用除以用戶數(shù)。得到每戶平均費用。但這到底還算不算度量了呢?這已經不是原本意義上的度量了,僅僅是為了稱呼方便而已。

這就得說到指標,英文的Metric。

在績效管理軟件里面,一般是有這個概念的。其定義可表述為"它是表示某種相對程度的值"。差別于度量概念,那是一種絕對值,尺子量出來的結果。匯總出來的數(shù)量等。

而指標至少須要兩個度量之間的計算才干得到,比如ARPU,用收入比上用戶數(shù),比如收入增長率,用本月收入比上上月收入。當然可能指標的計算還須要兩個以上的度量。

Indicator的字面意思為指示器,在KPI中,最后一個I就是它,可是用中文稱呼它的時候,總是叫"關鍵績效指標",而沒有叫做"指標器",也就造成一些混亂。

我們身邊充當指示器的有:紅綠燈。提醒行人車輛是否等待或通行;監(jiān)控室里的警報燈。提醒哪兒出現(xiàn)異常。汽車儀表盤。提醒駕駛員油是否足夠,速度怎樣。它們起到的作用是傳遞一種宏觀的信息。促使人的下一步行動。紅燈停綠燈行??吹骄瘓罅疗鹨s緊派人查看。

眼下常見的企業(yè)績效管理軟件中,儀表盤(有的地方稱作駕駛艙)的展示界面也是不可缺少。正是用這樣的直觀而比較有象征性的指示器反映企業(yè)運營狀況。

能夠設想提出KPI的初衷。是希望企業(yè)通過一些粗略(非細節(jié))的信息(而非數(shù)據(jù))來為下一步的決策作出根據(jù)。

導致不同的決策行為必然是離散的輸入。最簡單的就是一個開關。是或不是(比如警報燈)。假設說度量和指標是定量話,指示器就是一種定性的。

然而。這些系統(tǒng)中的KPI并不是全然上面提到的指示器,非常多系統(tǒng)建設稱為度量系統(tǒng)或是指標系統(tǒng)。而對一個企業(yè),哪些指標可以充分反映經營活動,這也是須要精心制定的。而不是讓技術部門提出一堆似是而非的指標名稱,諸如在網用戶數(shù)、收入之類,這不是KPI。

三者差別的說明:

"度量"是絕對的定量值。

"指標"是基于兩個或很多其它度量計算得出的相對值;

"指示器"是基于度量或指標,并根據(jù)某個基準值得到的定性結果。

 

二、維度中層與級的差別

OLAP中定義維度時,層(Hierarchy)與級(Level)是比較讓人迷惑的兩個概念。簡單的說,層就是一種維度成員的分類方式,級就是維度成員之間或維度成員屬性之間的包括關系。

一個維度至少要包括一個層。

[產品]維度為例,能夠創(chuàng)建一個[產地]層,能夠創(chuàng)建一個[廠商]層,也能夠創(chuàng)建一個[分類]層。在SSAS中。能夠不定義層,此時維度的默認層為AllMembers層。

MondrianSchema定義工具中。則要求所有手工定義。

一個層至少要包括一個級,以[產品]維度為例,[產地]層能夠包括省--縣三個級別,[分類]層能夠包括日用品-洗滌用品-洗衣粉三個級別。級別的定義有2種方式,一種是在一個維度成員的屬性之間定義,比如[產品]維度的每一個成員都有產品系列、大類、小類三個屬性,這樣定義[分類]層的級別時。直接利用這三個屬性就可以,即:每一個級別都是一個成員的一個屬性。還有一種是在維度成員之間進行。比如HR中的上下級關系。每一個級別都是一個詳細的維度成員,即:每一個級別都是一個或多個維度成員,每一個級都包括多個屬性。

后一種級別在數(shù)據(jù)庫中往往是以遞歸的方式進行保存的。

 

三、數(shù)據(jù)倉庫相關術語

數(shù)據(jù)倉庫:數(shù)據(jù)倉庫是一個支持管理決策的數(shù)據(jù)集合。數(shù)據(jù)是面向主題的、集成的、不易丟失的而且是時變的

數(shù)據(jù)倉庫是全部操作環(huán)境和外部數(shù)據(jù)源的快照集合。

它并不須要很精確,由于它必須在特定的時間基礎上從操作環(huán)境中提取出來。

數(shù)據(jù)集市:數(shù)據(jù)倉庫僅僅限于單個主題的區(qū)域,比如顧客、部門、地點等。數(shù)據(jù)集市在從數(shù)據(jù)倉庫獲取數(shù)據(jù)時能夠依賴于數(shù)據(jù)倉庫,或者當它們從操作系統(tǒng)中獲取數(shù)據(jù)時就不依賴于數(shù)據(jù)倉庫。

事實:事實是數(shù)據(jù)倉庫中的信息單元,也是多維空間中的一個單元,受分析單元的限制。

事實存儲于一張表中(當使用關系數(shù)據(jù)庫時)或者是多維數(shù)據(jù)庫中的一個單元。每一個事實包含關于事實(銷售額,銷售量,成本。毛利。毛利率等)的基本信息,而且與維度相關。在某些情況下,當全部的必要信息都存儲于維度中時,單純的事實出現(xiàn)就是對于數(shù)據(jù)倉庫足夠的信息。

維度維度是用來反映業(yè)務的一類屬性,這類屬性的集合構成一個維度。比如,某個地理維度可能包含國家、地區(qū)、省以及城市的級別。一個時間維度可能包含年、季、月、周、日的級別。

級別:維度層次結構的一個元素。

級別描寫敘述了數(shù)據(jù)的層次結構,從數(shù)據(jù)的最高(匯總程度最大)級別直到最低(最具體)級別(如大分類-中分類-小分類-細分類)。級別僅存在于維度內。

級別基于維度表中的列或維度中的成員屬性。

數(shù)據(jù)清洗:對數(shù)據(jù)倉庫系統(tǒng)沒用的或者不符合數(shù)據(jù)格式規(guī)范的數(shù)據(jù)稱之為臟數(shù)據(jù)。清洗的過程就是清除臟數(shù)據(jù)的過程。

數(shù)據(jù)採集:數(shù)據(jù)倉庫系統(tǒng)中后端處理的一部分。數(shù)據(jù)採集過程是指從業(yè)務系統(tǒng)中收集與數(shù)據(jù)倉庫各指標有關的數(shù)據(jù)。

數(shù)據(jù)轉換:解釋業(yè)務數(shù)據(jù)并改動其內容。使之符合數(shù)據(jù)倉庫數(shù)據(jù)格式規(guī)范,并放入數(shù)據(jù)倉庫的數(shù)據(jù)存儲介質中。

數(shù)據(jù)轉換包含數(shù)據(jù)存儲格式的轉換以及數(shù)據(jù)表示符的轉換(如產品代碼到產品名稱的轉換)。

聯(lián)機分析處理(OLAP Online Analytical Processing )OLAP是一種多維分析技術,用來滿足決策用戶在大量的業(yè)務數(shù)據(jù)中,從多角度探索業(yè)務活動的規(guī)律性、市場的運作趨勢的分析需求。并輔助他們進行戰(zhàn)略發(fā)展決策的制定。

依照數(shù)據(jù)的存儲方式分OLAP又分為ROLAPMOLAPHOLAP

在客戶信息數(shù)據(jù)倉庫CCDW的數(shù)據(jù)環(huán)境下,OLAP提供上鉆、下鉆、切片、旋轉等在線分析機制。完畢的功能包含多角度實時查詢、簡單的數(shù)據(jù)分析。并輔之于各種圖形展示分析結果。

數(shù)據(jù)挖掘:在數(shù)據(jù)倉庫的數(shù)據(jù)中發(fā)現(xiàn)新信息的過程被稱為數(shù)據(jù)挖掘,這些新信息不會從操作系統(tǒng)中獲得。

切片:一種用來在數(shù)據(jù)倉庫中將一個維度中的分析空間限制為數(shù)據(jù)子集的技術。

切塊:一種用來在數(shù)據(jù)倉庫中將多個維度中的分析空間限制為數(shù)據(jù)子集的技術。

星型模式:是數(shù)據(jù)倉庫應用程序的最佳設計模式。它的命名是因其在物理上表現(xiàn)為中心實體,典型內容包括指標數(shù)據(jù)、輻射數(shù)據(jù),一般是有助于瀏覽和聚集指標數(shù)據(jù)的維度。星形圖模型得到的結果經常是查詢式數(shù)據(jù)結構,可以為高速響應用戶的查詢要求提供最優(yōu)的數(shù)據(jù)結構。星形圖還經常產生一種包括維度數(shù)據(jù)和指標數(shù)據(jù)的兩層模型

雪花模式:指一種擴展的星形圖。星形圖通常生成一個兩層結構。即僅僅有維度和指標,雪花圖生成了附加層。實際數(shù)據(jù)倉庫系統(tǒng)建設過程中,通常僅僅擴展三層:維度(維度實體)、指標(指標實體)和相關的描寫敘述數(shù)據(jù)(類目細節(jié)實體);超過三層的雪花圖模型在數(shù)據(jù)倉庫系統(tǒng)中應該避免。由于它們開始像更傾向于支持OLTP 應用程序的規(guī)格化結構,而不是為數(shù)據(jù)倉庫和OLAP應用程序而優(yōu)化的非格式化結構。

粒度:粒度將直接決定所構建倉庫系統(tǒng)可以提供決策支持的細節(jié)級別。粒度越高表示倉庫中的數(shù)據(jù)較粗。反之。較細。

粒度是與詳細指標相關的,詳細表如今描寫敘述此指標的某些可分層次維的維值上。

比如,時間維度,時間可以分成年、季、月、周、日等。

數(shù)據(jù)倉庫模型中所存儲的數(shù)據(jù)的粒度將對信息系統(tǒng)的多方面產生影響。

事實表中以各種維度的什么層次作為最細粒度,將決定存儲的數(shù)據(jù)是否能滿足信息分析的功能需求。而粒度的層次劃分、以及聚合表中粒度的選擇將直接影響查詢的響應時間。

度量值:在多維數(shù)據(jù)集中,度量值是一組值。這些值基于多維數(shù)據(jù)集的事實數(shù)據(jù)表中的一列,并且通常為數(shù)字。此外。度量值是所分析的多維數(shù)據(jù)集的中心值。

即。度量值是終于用戶瀏覽多維數(shù)據(jù)集時重點查看的數(shù)字數(shù)據(jù)(如銷售、毛利、成本)。

本站僅提供存儲服務,所有內容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內容,請點擊舉報。
打開APP,閱讀全文并永久保存 查看更多類似文章
猜你喜歡
類似文章
數(shù)據(jù)倉庫學習筆記
BI 基礎知識測試以及答案
數(shù)據(jù)倉庫基礎知識
商務智能架構及其技術的討論
【樹形立方體】立方體有哪些特性?
OLAP
更多類似文章 >>
生活服務
分享 收藏 導長圖 關注 下載文章
綁定賬號成功
后續(xù)可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點擊這里聯(lián)系客服!

聯(lián)系客服