Kimball推崇數據集市的集合為數據倉庫,同時也提出了對數據集市的維度建模,將數據倉庫中的表劃分為事實表、維度表兩種類型。
- 事實表 在ER模型中抽象出了實體、關系、屬性三種類別。
在現實世界中,每一個操作型事件,基本都是發生在實體之間的,伴隨著這種操作事件的發生,會產生可度量的值,而這個過程就產生了一個事實表,存儲了每一個可度量的事件。
比如電商場景:一次購買事件,涉及主體包括客戶、商品、商家,產生的可度量值包括商品數量、金額、件數等。
- 維度:維度,很顯然就是看待事物的角度。比如從顏色、尺寸的角度來比較手機的外觀,從CPU、內存等比較手機性能。
維度表一般為單一主鍵,在ER模型中,實體為客觀存在的事務,會帶有自己的描述性屬性,屬性一般為文本性、描述性的,這些描述被稱為維度。
比如商品,商品ID是單一主鍵,屬性包括產地、顏色、材質、尺寸、單價等,但并非屬性一定是文本,比如單價、尺寸均為數值型描述性的。
日常主要的維度抽象包括:時間維度表、地理區域維度表等。