數據倉庫是大數據技術應用的重要體現方式之一,數據倉庫開發架構主要分為STG、ODS、DWD、DWS、ADS和DIM共6個層次,數據從底層開始,向上層進行傳遞、轉換、重組等操作,可以理解為,根據數據分析業務的需要,對原有的OLAP多維數據,進行維度和指標的重新組合。層次的具體描述如下:
STG原始數據層:用來表示原始數據在數據倉庫的落地,數據結構和原始系統發送上來的保持一致。
ODS數據操作層:用于原始數據在數據平臺的落地。數據從數據結構、數據之間的邏輯關系上都與原始數據層基本保持一致。在源數據裝入這一層時,要進行諸如業務字段提取或去掉不用字段、臟數據處理等等。在實際中不一定會同時創建STG和ODS,因為兩個層差異不大,更多的是創建ODS層.
DWD數據明細層:用于源系統數據在數據平臺中的永久存儲。它用以支撐DWS層和ADS層無法覆蓋的需求,比如像用戶購買詳單類業務需求。這一層主要解決一些數據質量問題和數據的完整度問題。
DWS數據服務層:數據匯總層,該層會在DWD層的數據基礎上。對數據做輕度的聚合操作,生成一系列的中間表,提升公共指標的復用性,減少重復加工。按照業務劃分,如流量、產品、用戶等,生成字段比較多的寬表,用于提供后續的業務查詢,OLAP分析,數據分發等。
ADS應用數據層:該層存放數據產品個性化的統計指標數據,一般以某個業務應用為出發點進行建設,ADS層只關心自己需要的數據,不會全盤考慮企業整體的數據架構和應用。面向實際的業務數據需求,以DWD或者DWS層的數據為基礎,組成各種統計報表。
DIM維度層:主要存儲公共的屬性數據,比如產品類別、地理位置、時間詳情等信息。綜上所述,數據倉庫建設的主要工作,就是對原始業務數據進行匯聚,進行分層次的數據處理,生成業務需要的數據,提供給前端業務使用。
更多關于大數據培訓的問題,歡迎咨詢千鋒教育在線名師,如果想要了解我們的師資、課程、項目實操的話可以點擊咨詢課程顧問,獲取試聽資格來試聽我們的課程,在線零距離接觸千鋒教育大咖名師,讓你輕松從入門到精通。