使用Solr構建企業級的全文檢索(二)---------管理界面簡介
昨天這個系列開篇了,今天就趁熱打鐵吧。有一點要注意的是,一開始我是在64位的Windows 7上的Tomcat中部署Solr的,在使用過程中發現非常的不穩定,經常添加兩個文檔或者是查詢一兩次后,tomcat就崩潰了,讓我對Solr的穩定性很是擔憂,又來部署到虛擬機中的CentOS上,非常的穩定又高效。在Windows 7上為什么不穩定,我沒有去分析,可能是因為各個組件的版本間的問題吧。如果哪位同學希望在Tomcat中部署Solr,請參考《Solr with Apache Tomcat》或者《在tomcat上部署solr 》。如果使用Tomcat,一定不要忘記在server.xml文件中connector節點中添加URIEncoding="UTF-8",否則你在做中文檢索的時候就會出問題。
現在環境已經搭建了好,我們通過http://localhost:8983/slor/admin地址來訪問Solr的管理頁面,如下:

簡要的介紹一下這個管理界面吧,首先是Schema,點擊這個鏈接可以看到Solr的conf目錄下的schema.xml文件的內容,從這里看到的內容和從Schema Browser鏈接里看到的內容是一致的,只是形式不同,SCHEMA BROWSER看到的更友好一些,兒SCHEMA里看到的就是原本的schema.xml的文本。在這兩個地方你都不能修改里面的內容。Schema文件定義了Solr里面存儲的文檔的字段類型以及字段,這個我們后邊會詳細講。
ANALYSIS這個鏈接是用來幫助你開發和調試的,如下圖:

在這里你可以很方便的測試你定義的字段類型以及字段是否正確,你指定字段,然后在Field Value(Index)中放入你期望分析的文檔內容,在Field Value(query)中放入你期望檢索的詞,點即Analyze按鈕,下邊就會出現文檔是如何進行分詞的,然后你檢索的詞命中的話就會高亮顯示。這個工具對于我們進行字段定義,配置是很有用的。
STATISTICS,顧名思義就是統計信息,在這里你可以看到在Solr里面索引了多少文檔,各種Handler的處理情況,比如搜索處理器,每秒鐘處理多少個響應,每個響應使用了多長時間,還有Cache的使用情況,比如林林種種的Cache是如何設置的,Cache的命中率如何,命中次數如何,自熱的次數以及自熱的用時等等,這些信息對日后的性能調校是又很大的用處的。
INFO的用處不太大,從這里面你可以看到Solr內部的這個種Handler是如何配置的。
Distribution 是用來查看Solr的分布式設置的,從這里你可以看到當前的Solr實例是Master Server還是Slave Server,系統是如何分布的。分布式正是Solr的強大之處,利用這些特性你可以很方便的Scale up或者Scale out你的系統。
在LOGGING里,你可以設定哪些日志是需要輸出的。
最后介紹一下管理界面中的一個重要的組成部分,就是Make a Query,如果你僅僅只是想看看現在solr里面是否能檢索到某個詞,就可以直接在這里輸入,然后查看結果,比如輸入“text:lucene”,就是查詢在text字段的內容中包含lucene這個單詞的文檔。這里能使用的功能十分有限,相當于僅僅只發送給Solr了q參數的內容。如果你想使用更復雜的查詢,那么點擊Make a Query 右邊的FULL INTERFACE,會出現下邊的界面:

不要被這個FULL INTERFACE給忽悠了,以為這就是Solr全部的查詢功能,其實,除了debug參數,這里面不過依次列出了q,fq,start,rows,fl,qt,hl,hl.fl參數,二實際上lucene/Solr提供的的查詢參數是數倍于這些。所以這個應付簡單的查詢還可以,復雜的查詢,可以通過查詢結果的地址欄手動修改吧,如下圖:

好了,天色已晚,今天就寫到這里吧,接下來講解schema的定義

浙公網安備 33010602011771號