HBase 數據模型中有三種字段類型:Row key、Column Family 和 Column Qualifier。
1.Row key:是表中每一行的唯一標識,類似于傳統數據庫中的主鍵。在 HBase 中,Row key 是按字典序排序的,并且可以自定義 Row key 的格式和編碼方式。
2.Column Family:是表中的一個邏輯分組,用于將一組相關的 Column Qualifier 歸為一類。在 HBase 中,一個 Column Family 通常包含多個 Column Qualifier,但是一個 Column Qualifier 只能屬于一個 Column Family。
3.Column Qualifier:是表中的一個具體的數據單元,用于存儲具體的數據。在 HBase 中,一個 Column Qualifier 通常與一個時間戳一起存儲,因此可以存儲多個版本的數據。
這三種字段類型在 HBase 中具有不同的含義和作用:
Row key 用于唯一標識一行數據,因此應該選擇具有唯一性的數據作為 Row key,例如用戶 ID、設備 ID 等。
Column Family 用于將相關的數據歸為一類,因此應該根據實際數據的關系和訪問模式來設計 Column Family。
Column Qualifier 用于存儲具體的數據,因此應該根據實際的數據類型和訪問模式來設計 Column Qualifier,例如將相同類型的數據放在同一個 Column Qualifier 中。
HBase 的數據模型是基于稀疏矩陣的,即只存儲非空的單元格,因此可以有效地節省存儲空間。同時,由于 HBase 支持多版本數據的存儲,因此可以滿足不同的查詢需求。