中文銳推榜優(yōu)化·二
一、Twitter 搜索索引的問題
由于銳推榜利用的是 Twitter Search API 入口,所以是否能足夠全地找到所有中文 Retweets(又名:銳推/RT/轉(zhuǎn)推) ,很多時候取決于 twitter 自己的索引是否能正確地識別 tweet 所采用的語言。
今年曾經(jīng)有一度,長達(dá)一個月的時間,Twitter 的亞洲語言索引全部亂掉,日文、泰語、韓文、中文等語言寫就的 Tweets 混亂地分布在不同國家語言的索引中,而日文和中文的索引幾乎不再更新。所以說,Twitter 的搜索真的真的很需要 FriendFeed 這樣的實時搜索技術(shù)專家支援。
Twitter Search 不能良好地識別 Tweets 語言的結(jié)果,可能就是 中文銳推榜 會漏掉消息。
二、包含 RT 單詞的消息并不都是銳推
這個問題其實相當(dāng)嚴(yán)重,最近至少發(fā)生過兩次。上次是某人發(fā)消息送大禮,消息體內(nèi)說請大家RT。結(jié)果 銳推榜 默認(rèn)將第一個找到的轉(zhuǎn)發(fā)消息正文作為上榜消息正文,于是很多人以為是 @rtmeme 要派送大禮。
這次是 @faytoday 發(fā)消息求助,正文的“rt會走桃花運.”帶了RT標(biāo)志,于是銳推榜檢測到足夠多的轉(zhuǎn)發(fā)次數(shù)后,就原樣轉(zhuǎn)發(fā)了這條消息,害得 @faytoday 回復(fù)說 @rtmeme 搶了他的風(fēng)頭。
銳推榜只是搜索 tweets 文字中的 RT/Retweet/Retweeting/rTwt/轉(zhuǎn)發(fā):等單詞,所以程序并不能明確判別一個 tweet 是不是銳推。
但必須改進(jìn)這一點。
銳推榜針對“始發(fā)消息中含RT字樣但并不是銳推”的情況,將自動在上榜消息前把找到的第一個消息發(fā)送者的用戶帳號按照“RT @first_rtuser_id ”的格式加上,這樣大家就不會誤認(rèn)為是 @rtmeme 在發(fā)推或評論了。
舉例:
現(xiàn)在,統(tǒng)計程序檢測到超過6個人在轉(zhuǎn)發(fā)這條消息:“RT @Fenng: 有些公司的促銷活動就是浪費。專門給愛占小便宜和鉆空子的用戶準(zhǔn)備的。用戶只有有需求才用你的網(wǎng)站,而不是湊熱鬧才用你的網(wǎng)站。”,那么它應(yīng)該上榜;然后找到銳推榜所能索引到的第一個轉(zhuǎn)發(fā)者ID是 @xuyangchina ,于是,這條上榜消息就變成了:
“
RT @xuyangchina: RT @Fenng: 有些公司的促銷活動就是浪費。專門給愛占小便宜和鉆空子的用戶準(zhǔn)備的。用戶只有有需求才用你的網(wǎng)站,而不是湊熱鬧才用你的網(wǎng)站。
”
這樣做的缺點就是,@rtmeme 本來可以在銳推傳播路線圖上處于第二傳播梯隊,現(xiàn)在不得不變成第三傳播梯隊。
就是這樣了。
參考資源:
1、《中文銳推榜的優(yōu)化》2009-06-16
2、《中文銳推榜的一個里程碑》2009-06-19
3、《中文微博客的熱門銳推用戶榜》2009-06-25

浙公網(wǎng)安備 33010602011771號