一、NoSQL 運動給數據庫系統留下什么寶貴的思想
如果非要給NoSQL一個歷史定位的話,那應該是一次對關系型數據庫的解構運動。
這次解構運動的發起是由于互聯網應用的興起,由于互聯網對存儲的使用重規模輕邏輯,所以導致傳統的關系型數據庫使用成本過高。于是促長了MySQL等開源數據庫的發展和成長。對那些開源的關系型數據庫進行解構,造成了NoSQL的局面。但問題在于當時那群年輕的互聯網程序員沒有好好回顧數據庫的發展史,而是帶著操作系統(文件系統)的包袱去解構的,再加上操作系統陣營和數據庫陣營歷來的對壘,導致了這場不應該發生的重復造輪子運動。
如果對數據庫內核開發了解的同學應該知道,所有關系型數據庫都是從鍵值數據庫發展起來的,數據存儲引擎最底層都是一個鍵值數據庫。還有現在流行的各種消息中間件(RABBIT MQ之流)也是關系數據庫中的一個零件而已(connection),是在網絡興起后,數據庫提供CS架構下誕生的遠程訪問方案。所以就像一個小男孩喜歡拆玩具車,把電動機拿下來單獨轉;把輪子拆下來單獨滾,自得其樂。
如果非要說留下什么寶貴思想,那就是當你覺得要做一件了不起的事情時,先查一下歷史,也許已經有人淌過了,你就別再攪混水了。不過好像沒什么卵用,歷史總是不斷的重復,這不“無/低代碼”運動又來了。
延伸閱讀:
二、數據庫的查詢功能實現原理
數據庫查詢是數據庫的最主要功能之一。我們都希望查詢數據的速度能盡可能的快,因此數據庫系統的設計者會從查詢算法的角度進行優化。最基本的查詢算法當然是順序查找(linear search),這種復雜度為O(n)的算法在數據量很大時顯然是糟糕的,好在計算機科學的發展提供了很多更優異的查找算法,例如二分查找(binary search)、二叉樹查找(binary tree search)等。如果稍微分析一下會發現,每種查找算法都只能應用于特定的數據結構之上,例如二分查找要求被檢索數據有序,而二叉樹查找只能應用于二叉查找樹上,但是數據本身的組織結構不可能完全滿足各種數據結構(例如,理論上不可能同時將兩列都按順序進行組織),所以,在數據之外,數據庫系統還維護著滿足特定查找算法的數據結構,這些數據結構以某種方式引用(指向)數據,這樣就可以在這些數據結構上實現高級查找算法。這種數據結構,就是索引。