個(gè)性化搜索引擎調(diào)研(一)
一、為什么要做個(gè)性化搜索引擎?
每天網(wǎng)上爆發(fā)的信息量已經(jīng)超過了我們能接受的范圍,只有因人而異的個(gè)性化搜索才能幫助用戶找到所需信息。
傳統(tǒng)信息檢索具有通用性,檢索系統(tǒng)不可能滿足不同背景、不同目的和不同時(shí)期的查詢請(qǐng)求,一個(gè)關(guān)鍵字查詢?cè)~對(duì)所有用戶呈現(xiàn)的搜索結(jié)果均相同。
Google的美女副總裁Marissa Mayer說“我們認(rèn)為,2020年的搜索引擎贏家可能會(huì)更加了解它的用戶?!?,“即便現(xiàn)在我們還不知道什么才是未來個(gè)性化搜索的主要決定因素。但我們斷定,個(gè)性化搜索肯定會(huì)成為未來搜索引擎的重要組成部分。”(谷歌的第20名員工,谷歌搜索產(chǎn)品和用戶體驗(yàn)副總裁瑪麗莎·梅耶爾)
搜索引擎的未來在于個(gè)性化。是必然趨勢(shì)。
二、個(gè)性化搜索引擎的目標(biāo)?
1、準(zhǔn)確描述用戶興趣。為不同用戶提供不同的服務(wù), 以滿足不同的需求。提高站點(diǎn)的服務(wù)質(zhì)量和訪問效率,從而吸引更多的訪問者。
2、”用戶感應(yīng)式的PageRank(user sensitive PageRank)”,我們會(huì)看到搜索引擎感興趣的不單單是某個(gè)單一用戶的個(gè)性化搜索,而是某些用戶的分類化(式)的個(gè)性化(較小范圍內(nèi)顯性/隱性用戶反饋的集合)。
3、直覺搜索(intuitive search)。能夠在用戶沒有考慮清楚要尋找什么之前,為用戶呈現(xiàn)所需的信息。
三、目前個(gè)性化搜索引擎的分類?
個(gè)性化服務(wù)根據(jù)其所采用的推薦技術(shù)可以分為兩種:基于規(guī)則的系統(tǒng)和基于信息過濾的系統(tǒng).(信息過濾系統(tǒng)又可分為基于內(nèi)容過濾的系統(tǒng)和基于協(xié)作過濾的系統(tǒng).)
四、目前較好的個(gè)性化搜索引擎優(yōu)缺點(diǎn)?
基于規(guī)則的系統(tǒng)利用預(yù)定義的規(guī)則來過濾信息,它的優(yōu)點(diǎn)是簡(jiǎn)單直接,缺點(diǎn)是規(guī)則質(zhì)量很難保證,而且不能動(dòng)態(tài)更新,此外,隨著規(guī)則的數(shù)量增多,系統(tǒng)將變得越來越難以管理.
基于內(nèi)容過濾的系統(tǒng)利用資源與用戶興趣的相似性來過濾信息,它的關(guān)鍵問題是相似性計(jì)算,它的優(yōu)點(diǎn)是簡(jiǎn)單有效,缺點(diǎn)是難以區(qū)分資源內(nèi)容的品質(zhì)和風(fēng)格,而且不能為用戶發(fā)現(xiàn)新的感興趣的資源,只能發(fā)現(xiàn)和用戶已有興趣相似的資源.
協(xié)作過濾系統(tǒng)利用用戶之間的相似性來推薦信息,它能夠?yàn)橛脩舭l(fā)現(xiàn)新的感興趣的內(nèi)容,它的關(guān)鍵問題是用戶聚類,其缺點(diǎn)是需要用戶的參與.

浙公網(wǎng)安備 33010602011771號(hào)