當緩存庫出現時,必須要考慮如下問題:
緩存穿透
問題來源: 緩存穿透是指緩存和數據庫中都沒有的數據,而用戶不斷發起請求。由于緩存是不命中時被動寫的,并且出于容錯考慮,如果從存儲層查不到數據則不寫入緩存,這將導致這個不存在的數據每次請求都要到存儲層去查詢,失去了緩存的意義。
解決方案
接口層增加校驗,如用戶鑒權校驗,id做基礎校驗,id<=0的直接攔截;
從緩存取不到的數據,在數據庫中也沒有取到,這時也可以將key-value對寫為key-null,緩存有效時間可以設置短點,如30秒(設置太長會導致正常情況也沒法使用)。這樣可以防止攻擊用戶反復用同一個id暴力攻擊
布隆過濾器。bloomfilter就類似于一個hash set,用于快速判某個元素是否存在于集合中,其典型的應用場景就是快速判斷一個key是否存在于某容器,不存在就直接返回。布隆過濾器的關鍵就在于hash算法和容器大小
緩存穿擊
問題來源: 緩存擊穿是指緩存中沒有但數據庫中有的數據(一般是緩存時間到期),這時由于并發用戶特別多,同時讀緩存沒讀到數據,又同時去數據庫去取數據,引起數據庫壓力瞬間增大,造成過大壓力。
解決方案
設置熱點數據永遠不過期。
接口限流與熔斷,降級。重要的接口一定要做好限流策略,防止用戶惡意刷接口,同時要降級準備,當接口中的某些 服務 不可用時候,進行熔斷,失敗快速返回機制。
加互斥鎖
緩存雪崩
問題來源: 緩存雪崩是指緩存中數據大批量到過期時間,而查詢數據量巨大,引起數據庫壓力過大甚至down機。和緩存擊穿不同的是,緩存擊穿指并發查同一條數據,緩存雪崩是不同數據都過期了,很多數據都查不到從而查數據庫。
解決方案
緩存數據的過期時間設置隨機,防止同一時間大量數據過期現象發生。
如果緩存數據庫是分布式部署,將熱點數據均勻分布在不同的緩存數據庫中。
設置熱點數據永遠不過期。
緩存污染(或者滿了)
緩存污染問題說的是緩存中一些只會被訪問一次或者幾次的的數據,被訪問完后,再也不會被訪問到,但這部分數據依然留存在緩存中,消耗緩存空間。
緩存污染會隨著數據的持續增加而逐漸顯露,隨著服務的不斷運行,緩存中會存在大量的永遠不會再次被訪問的數據。緩存空間是有限的,如果緩存空間滿了,再往緩存里寫數據時就會有額外開銷,影響Redis性能。這部分額外開銷主要是指寫的時候判斷淘汰策略,根據淘汰策略去選擇要淘汰的數據,然后進行刪除操作。