T-SQL查詢高級--理解SQL SERVER中非聚集索引的覆蓋，連接，交叉和過濾

寫在前面:這是第一篇T-SQL查詢高級系列文章.但是T-SQL查詢進階系列還遠遠沒有寫完。這個主題放到高級我想是因為這個主題需要一些進階的知識作為基礎..如果文章中有錯誤的地方請不吝指正.本篇文章的內容需要索引的知識作為基礎。

簡介

在SQL SERVER中，非聚集索引其實可以看作是一個含有聚集索引的表.但相比實際的表而言.非聚集索引中所存儲的表的列數要窄很多，因為非聚集索引僅僅包含原表中非聚集索引的列和指向實際物理表的指針。

并且，對于非聚集索引表來說，其中所存放的列是按照聚集索引來進行存放的.所以查找速度要快了很多。但是對于性能的榨取來說，SQL SERVER總是竭盡所能，假如僅僅是通過索引就可以在B樹的葉子節點獲取所需數據，而不再用通過葉子節點上的指針去查找實際的物理表,那性能的提升將會更勝一籌.

下面我們來看下實現這一點的幾種方式.

非聚集索引的覆蓋

正如前面簡介所說。非聚集索引其實可以看作一個聚集索引表.當這個非聚集索引中包含了查詢所需要的所有信息時，則查詢不再需要去查詢基本表，而僅僅是從非聚集索引就能得到數據:

下面來看非聚集索引如何覆蓋的:

在adventureWorks的SalesOrderHeader表中，現在只有CustomerID列有非聚集索引，而BillToAddressID沒有索引，我們的查詢計劃會是這樣:

查詢會根據CustomerID列上的非聚集索引找到相應的指針后，去基本表上查找數據.從執行計劃可以想象，這個效率并不快。

下面我們來看覆蓋索引，通過在CustomerID和BillToAddressID上建立非聚集索引，我們覆蓋到了上面查詢語句的所有數據:

通過覆蓋索引，可以看到執行計劃簡單到不能再簡單，直接從非聚集索引的葉子節點提取到數據，無需再查找基本表！

這個性能的提升可以從IO統計看出來,下面我們來看有覆蓋索引和沒有覆蓋索引的IO對比:

索引的覆蓋不僅僅帶來的是效率的提升，還有并發的提升，因為減少了對基本表的依賴，所以提升了并發，從而減少了死鎖！

理解INCLUDE的魔力

上面的索引覆蓋所帶來的效率提升就像魔術一樣，但別著急，正如我通篇強調的一樣，everything has price.如果一個索引包含了太多的鍵的話，也會帶來很多副作用。INCLUDE的作用使得非聚集索引中可以包含更多的列，但不作為“鍵”使用。

比如:假設我們上面的那個查詢需要增加一列，則原來建立的索引無法進行覆蓋，從而還需要查找基本表:

但是如果要包含SubTotal這個總金額，則索引顯得太寬，因為我們的業務很少根據訂單價格作為查詢條件,則使用INCLUDE建立索引:

理解INCLUDE包含的列和索引建立的列可以這樣理解,把上述建立的含有INCLUDE的非聚集索引想像成:

使用INCLUDE可以減少葉子“鍵”的大小!

非聚集索引的交叉

非聚集索引的交叉看以看作是覆蓋索引的擴展！

由于很多原因，比如：

在生產環境中，我們往往不能像上面建立覆蓋索引那樣隨意改動現有索引，這可能導致的結果是你會更頻繁的被客戶打電話“關照”
現有的非聚集索引已經很“寬”，你如果繼續拓寬則增改查帶來的性能下降的成本會高過提高查詢帶來的好處

這時候，你可以通過額外建立索引。正如我前面提到的，非聚集索引的本質是表，通過額外建立表使得幾個非聚集索引之間進行像表一樣的Join,從而使非聚集索引之間可以進行Join來在不訪問基本表的情況下給查詢優化器提供所需要的數據:

比如還是上面的那個例子.我們需要查取SalesOrderHeader表,通過BillToAddressID,CustomerID作為選擇條件，可以通過建立兩個索引進行覆蓋,下面我們來看執行計劃:

非聚集索引的連接

非聚集索引的連接實際上是非聚集索引的交叉的一種特例。使得多個非聚集索引交叉后可以覆蓋所要查詢的數據，從而使得從減少查詢基本表變成了完全不用查詢基本表:

比如還是上面那兩個索引，這時我只查詢非聚集索引中包含的數據，則完全不再需要查詢基本表:

非聚集索引的過濾

很多時候，我們并不需要將基本表中索引列的所有數據全部索引，比如說含有NULL的值不希望被索引，或者根據具體的業務場景，有一些數據我們不想索引。這樣可以:

減少索引的大小
索引減少了，從而使得對索引的查詢得到了加速
小索引對于增刪改的維護性能會更高

比如說,如下語句:

我們為其建立聚集索引后:

這時我們為其加上過濾條件，形成過濾索引:

由上面我們可以看出，使用過濾索引的場景要和具體的業務場景相關，對于為大量相同的查詢條件建立過濾索引使得性能進一步提升！

總結

本文從介紹了SQL SERVER中非聚集索引的覆蓋，連接，交叉和過濾。對于我們每一點從SQL SERVER榨取的性能的提升往往會伴隨著另一方面的犧牲。作為數據庫的開發人員或者管理人員來說，以全面的知識來做好權衡將會是非常重要.系統的學習數據庫的知識不但能大量減少邏輯讀的數據，也能減少客戶打電話"關照”的次數:-)

posted @ 2011-12-27 14:18 CareySon 閱讀(18366) 評論(51) 收藏舉報

刷新頁面返回頂部