常數復雜度獲取字符串長度
由于 len 屬性的存在,我們獲取 SDS 字符串的長度只需要讀取 len 屬性,時間復雜度為 O(1)。而對于 C 語言,獲取字符串的長度通常是經過遍歷計數來實現的,時間復雜度為 O(n)。通過 strlen key 命令可以獲取 key 的字符串長度。
杜絕緩沖區溢出
我們知道在 C 語言中使用 strcat 函數來進行兩個字符串的拼接,一旦沒有分配足夠長度的內存空間,就會造成緩沖區溢出。而對于 SDS 數據類型,在進行字符修改的時候,會首先根據記錄的 len 屬性檢查內存空間是否滿足需求,如果不滿足,會進行相應的空間擴展,然后在進行修改操作,所以不會出現緩沖區溢出。
減少修改字符串的內存重新分配次數
C語言由于不記錄字符串的長度,所以如果要修改字符串,必須要重新分配內存(先釋放再申請),因為如果沒有重新分配,字符串長度增大時會造成內存緩沖區溢出,字符串長度減小時會造成內存泄露。
而對于SDS,由于len屬性和alloc屬性的存在,對于修改字符串SDS實現了空間預分配和惰性空間釋放兩種策略:
1.空間預分配:對字符串進行空間擴展的時候,擴展的內存比實際需要的多,這樣可以減少連續執行字符串增長操作所需的內存重分配次數。
2.惰性空間釋放:對字符串進行縮短操作時,程序不立即使用內存重新分配來回收縮短后多余的字節,而是使用 alloc 屬性將這些字節的數量記錄下來,等待后續使用。(當然SDS也提供了相應的API,當我們有需要時,也可以手動釋放這些未使用的空間。)
二進制安全
因為C字符串以空字符作為字符串結束的標識,而對于一些二進制文件(如圖片等),內容可能包括空字符串,因此C字符串無法正確存取;而所有 SDS 的API 都是以處理二進制的方式來處理 buf 里面的元素,并且 SDS 不是以空字符串來判斷是否結束,而是以 len 屬性表示的長度來判斷字符串是否結束。
兼容部分 C 字符串函數
雖然 SDS 是二進制安全的,但是一樣遵從每個字符串都是以空字符串結尾的慣例,這樣可以重用 C 語言庫<string.h> 中的一部分函數。