一文讓你對mysql索引底層實現明明白白

開篇：

圖片是本人隨筆畫的，有點粗糙，望大家諒解，如有不妥之處，請聯系我們，感謝

一、索引到底是什么

.索引是幫助mysql高效獲取數據的排好序的數據結構

.索引是存儲在文件里的

.數據結構：二叉樹 HASH BTREE

如果沒有索引的話，循環一條一條的找，找一次就是一次IO，這樣速度就會很慢

我們知道數據庫數據都是存在磁盤上的，當我們查找數據時，就會從磁盤上取數據,每取一次就是一次IO，IO是非常耗時的，為了速度快會把數據放到緩存里，然后在緩存里進行操作

二、磁盤存取原理

當查找數據的時候，就是磁頭循環找此道，就會一直循環查找，一次查找就是一次IO，IO是很耗時的

三、Mysql數據結構詳解

就拿上面的7條數據來說，如果沒有索引，當我們查找第7條數據時，就會循環7次，如果有百萬級別的數據，那么就會查找百萬次，顯然這樣是不行的，就需要數據結構算法來優化，那我們就從二叉樹----HASH---BTREE來一一說起

二叉樹：

二叉樹節點保存的都是單個索引，高度會隨著數據增大而增高，但是比一條一條的循環會快

不用二叉樹是因為的極端情況下會出現單邊增長，這樣在數量大的情況下，和一條一條查找沒有區別。

紅黑樹：

紅黑樹有自平衡性質，不會出現單邊增長，它會動態自旋轉，在性能上比二叉樹又高一點，但是mysql也沒有用這種數據結構，因為數據量超大的情況下，數據高度也會一直增大，在最終這個樹高度也非常大，解決不了根本問題

HASH:

hash算法一次就會定位到文件指針，速度快，但是還是沒有用，如果范圍查找的話就沒有辦法了，如果只是內存中的話，他的時間復雜度是O(1),速度會會很快，但是索引文件也是保存在磁盤上，而且hash是不連續的放在磁盤上的，這樣查詢起來也很慢，這才是不用hash的最根本原因

B-TREE:

相比上面的數據結構，b-tree增加了橫向大?。ǘ菵egree），那么在高度上就減小了，查找次數就少了

15，56，77.。。。。是索引，data就是對應的一行數據

那么在橫向的度上最大多少合適呢？？總不能橫向上一直擴展下呀，磁盤一次IO，就是取一個橫向的節點（度），把一個節點的數據放在緩存中，那么一次IO也不能把所用的數據全取出來，所以最好是一次io，就把這個節點全取處理，電腦操作系統從磁盤一次取數據到內存中一般是4K，而mysql取一次數據一般是16K，所以橫向節點一般設置為16K。因為一個節點設置成16K的話，這個節點保存了索引和索引對應行的數據，那么這個節點橫向保存不了太多的數據，所以，這種數據結構也不合適，引入新的數據結構