微博關(guān)注者數(shù)量在計算中的作用
鄭昀 20101011
一個微博用戶的關(guān)注者數(shù)量(在Twitter中稱為Followers),有幾種用途:
一、對于Google來說,由于一個用戶關(guān)注另一個用戶,相當于一個頁面指向另一個頁面,所以PageRank的算法大致可照搬。
"One user following another in social media is analogous to one page linking to another on the Web. Both are a form of recommendation," Singhal tells Technology Review. "As high-quality pages link to another page on the Web, the quality of the linked-to page goes up. Likewise, in social media, as established users follow another user, the quality of the followed user goes up as well."
當決定哪一條微博消息(Tweet)要顯示在搜索結(jié)果中前列時,Google不單單關(guān)注followers的數(shù)量,還關(guān)注這些followers的價值。
二、在熱門消息榜類型的應(yīng)用里,卻要反其道而行之,要削減followers多的用戶權(quán)重。
對于微博客來說,如果要做一個熱門消息實時榜單,有一個問題繞不過去,那就是對人氣特別旺的帳號如何處理?在做Twitter銳推榜時,很多人提出這個問題,能不能讓那些followers數(shù)量巨大的人少上榜,更有人建議讓上榜閾值與該用戶的followers數(shù)掛鉤,比如成反比,followers越多,上榜越困難。
由于followers數(shù)與微博消息的價值之間沒有明確的關(guān)聯(lián),所以不適合簡單粗暴地成反比。
在針對國內(nèi)微博網(wǎng)站,如新浪微博,制作熱門轉(zhuǎn)發(fā)消息實時榜單(t.rtmeme.com)時,我采用如下簡單的規(guī)則,來減少名人上榜幾率。
加入關(guān)注者數(shù)量的考量
一條消息是否能夠上榜,當然取決于它的轉(zhuǎn)發(fā)數(shù)和評論數(shù),但是名人關(guān)注者多(粉絲多),理所當然地有更大幾率被轉(zhuǎn)發(fā),然而名人的消息未必有什么價值。t.rtmeme.com雖然一直在阻止明星推上榜,但名人或者說人氣比較旺的用戶,卻很難遏制。
所以需要在t.rtmeme.com上榜公式中引入關(guān)注者數(shù)量這個參數(shù)。
一般來說,在新浪微博中,1K個關(guān)注者意味著轉(zhuǎn)發(fā)數(shù)可能是個位數(shù)的,10K個關(guān)注者時轉(zhuǎn)發(fā)數(shù)可能平均達到兩位數(shù),所以可以近似一個轉(zhuǎn)發(fā)比率1:1K。
那么一個關(guān)注者數(shù)為88萬的名人@馮小剛 ,他的轉(zhuǎn)發(fā)因子是880(即期望平均轉(zhuǎn)發(fā)數(shù)是880次);此時,如果他有一條消息被轉(zhuǎn)發(fā)了1000次,那么1000/880=1.14,這個數(shù)字代表轉(zhuǎn)發(fā)數(shù)是否超過預(yù)期。
下面再多舉些例子:
關(guān)注者數(shù)為31352的@作業(yè)本 ,轉(zhuǎn)發(fā)因子是31;他的某消息轉(zhuǎn)發(fā)數(shù)是544,那么544/31=17.5,就說明該消息價值明顯優(yōu)于馮小剛的那條。
關(guān)注者數(shù)為1,894,927的@李開復(fù) ,轉(zhuǎn)發(fā)因子是1894;某消息轉(zhuǎn)發(fā)數(shù)是5351,那么5351/1984=2.69,也還在水準之上。
關(guān)注者數(shù)為1,981,311的@任志強 ,他某條被轉(zhuǎn)發(fā)了85次的消息轉(zhuǎn)發(fā)水準度就是85/1981=0.04,就很不值得上榜(如果不考慮這個因子,那么憑借轉(zhuǎn)發(fā)數(shù)多評論數(shù)多,它肯定可以上榜)。
關(guān)注者數(shù)為917,734的@頭條新聞 ,他某條轉(zhuǎn)發(fā)了320次的消息,水準度是320/917=0.34,相當一般的消息,可入可不入榜。
關(guān)注者數(shù)為434,135的@新浪娛樂 ,某條轉(zhuǎn)發(fā)了99次的消息,水準度是99/434=0.22,所以說很多新浪自己維護的帳號,所發(fā)的消息大多不值得上榜。
因此設(shè)置一個轉(zhuǎn)發(fā)水準度的閾值,比如要求每條上榜消息的轉(zhuǎn)發(fā)水準度大于0.5,就能避免大明星、名人、人氣王們隨隨便便發(fā)條消息就能上榜。
[完]

浙公網(wǎng)安備 33010602011771號