HBase如何處理熱點數據問題(數據傾斜) 2022-08-12
在大量客戶端請求訪問數據或者寫入數據的時候,只有少數幾個或者一個 RegionServer 做出響應,導致該服務器的負載過高,造成讀寫效率低下,而...詳情>
HBase參數優化方案,看過來 2022-08-12
HBase 的參數很多,一般都是在使用和優化的過程中不斷地調整的,這里只列舉出比較重要和常用的幾個HBase參數優化方案,大家可以參考一下。詳情>
HBase的二級索引的設計 2022-08-12
1. 協處理器coprocessor方案。 原理就是自定義協處理器,實現`雙寫`,就是寫主表的時候,同時寫索引表[這里這個索引表是根據業務對查詢的需求建...詳情>
Flink Spark on Yarn 分布式日志收集問題 2022-08-12
對于Flink,Spark在Yarn上提交的LongTime Job(比如一個批處理作業要運行幾個小時或者本身就是實時作業),其作業的運行日志我們不能等到作業結...詳情>
Spark Streaming Kafka Offset為什么不用Checkpoint管理 2022-08-12
Spark Streaming消費Kafka,對于offset的管理方式一般有如下方式:1. checkpoint 方式管理,通過checkpoint可以將消費的offset持久化存儲到hdf...詳情>
HBase系列常見面試題匯總---HBase數據讀取流程分析以及Region分裂如何定位切分點 2022-08-12
1.HBase 數據讀取流程分析,從 zookeeper 獲得 meta 表所在 region 位置,再根據 table、namespace、rowkey 去 meta 表中獲取讀對象所在的 Reg...詳情>
HBase系列常見面試題匯總---HBase如何保證讀的高效以及數據的強一致性 2022-08-12
1.HBase如何保證讀的高效?緩存:* HBase 有兩塊主要的內存緩存,MemStore 和 BlockCache。 * 一個查詢過來 RegionServer 后,首先用 MemStore...詳情>
HBase系列常見面試題匯總---怎么實現HBase的加鹽之后的Key找Value 2022-08-12
1.怎么實現HBase的加鹽之后的Key找Value?兩種方式:如果是隨機加鹽,通過自定義一個HBase協處理器[coprocessors]來實現。加鹽時,使用hash截...詳情>
HBase系列常見面試題匯總---HBase的MVCC多版本并發機制 2022-08-12
MVCC(Multi Version Consistency Control),簡單地說,是一種通過數據的多版本來解決讀寫一致性問題的解決方案。我們知道 HBase 是會保留多版...詳情>
HBase系列常見面試題匯總---HBase建表優化 2022-08-12
BloomFilter* 默認值為 NONE,布隆過濾器的作用是可以過濾掉大部分不存在目標查詢值的 HFile(即略去不必要的磁盤掃描),可以有助于降低讀取延...詳情>
在線提問
專業導師線上坐鎮,解答個性化學習難題
提交問題