使用Solr構建企業級的全文檢索（二）---------管理界面簡介

昨天這個系列開篇了，今天就趁熱打鐵吧。有一點要注意的是，一開始我是在64位的Windows 7上的Tomcat中部署Solr的，在使用過程中發現非常的不穩定，經常添加兩個文檔或者是查詢一兩次后，tomcat就崩潰了，讓我對Solr的穩定性很是擔憂，又來部署到虛擬機中的CentOS上，非常的穩定又高效。在Windows 7上為什么不穩定，我沒有去分析，可能是因為各個組件的版本間的問題吧。如果哪位同學希望在Tomcat中部署Solr，請參考《Solr with Apache Tomcat》或者《在tomcat上部署solr 》。如果使用Tomcat，一定不要忘記在server.xml文件中connector節點中添加URIEncoding="UTF-8"，否則你在做中文檢索的時候就會出問題。

現在環境已經搭建了好，我們通過http://localhost:8983/slor/admin地址來訪問Solr的管理頁面，如下：

簡要的介紹一下這個管理界面吧，首先是Schema，點擊這個鏈接可以看到Solr的conf目錄下的schema.xml文件的內容，從這里看到的內容和從Schema Browser鏈接里看到的內容是一致的，只是形式不同，SCHEMA BROWSER看到的更友好一些，兒SCHEMA里看到的就是原本的schema.xml的文本。在這兩個地方你都不能修改里面的內容。Schema文件定義了Solr里面存儲的文檔的字段類型以及字段，這個我們后邊會詳細講。

ANALYSIS這個鏈接是用來幫助你開發和調試的,如下圖：

在這里你可以很方便的測試你定義的字段類型以及字段是否正確，你指定字段，然后在Field Value（Index）中放入你期望分析的文檔內容，在Field Value（query）中放入你期望檢索的詞，點即Analyze按鈕，下邊就會出現文檔是如何進行分詞的，然后你檢索的詞命中的話就會高亮顯示。這個工具對于我們進行字段定義，配置是很有用的。

STATISTICS,顧名思義就是統計信息，在這里你可以看到在Solr里面索引了多少文檔，各種Handler的處理情況，比如搜索處理器，每秒鐘處理多少個響應，每個響應使用了多長時間，還有Cache的使用情況，比如林林種種的Cache是如何設置的，Cache的命中率如何，命中次數如何，自熱的次數以及自熱的用時等等，這些信息對日后的性能調校是又很大的用處的。

INFO的用處不太大，從這里面你可以看到Solr內部的這個種Handler是如何配置的。

Distribution 是用來查看Solr的分布式設置的，從這里你可以看到當前的Solr實例是Master Server還是Slave Server，系統是如何分布的。分布式正是Solr的強大之處，利用這些特性你可以很方便的Scale up或者Scale out你的系統。

在LOGGING里，你可以設定哪些日志是需要輸出的。

最后介紹一下管理界面中的一個重要的組成部分，就是Make a Query,如果你僅僅只是想看看現在solr里面是否能檢索到某個詞，就可以直接在這里輸入，然后查看結果，比如輸入“text:lucene”,就是查詢在text字段的內容中包含lucene這個單詞的文檔。這里能使用的功能十分有限，相當于僅僅只發送給Solr了q參數的內容。如果你想使用更復雜的查詢，那么點擊Make a Query 右邊的FULL INTERFACE，會出現下邊的界面：

不要被這個FULL INTERFACE給忽悠了，以為這就是Solr全部的查詢功能，其實，除了debug參數，這里面不過依次列出了q，fq，start，rows，fl，qt，hl，hl.fl參數，二實際上lucene/Solr提供的的查詢參數是數倍于這些。所以這個應付簡單的查詢還可以，復雜的查詢，可以通過查詢結果的地址欄手動修改吧，如下圖：

好了，天色已晚，今天就寫到這里吧，接下來講解schema的定義

posted @ 2011-12-08 23:16 綸巾客閱讀(5218) 評論(3) 收藏舉報

刷新頁面返回頂部

白話Programming

使用Solr構建企業級的全文檢索（二）---------管理界面簡介

公告