摘要:
如果你曾經為網站做過單詞或短語分析以便獲得更好的搜索排名,你會對SSIS的這個任務很感興趣。關鍵詞提取任務是從文本流中查找并計算關鍵詞的出現頻率的工具。它可與接收任何形式的文本,輸出兩列:一列是關鍵詞,另一列是這個關鍵詞在文本中出現的頻率的統計值。這個統計值可以是該關鍵詞出現的次數,也可以是使用稍微復雜一點的計算公式(TFIDF)計算得出的幾率值。縮寫詞TFIDF的全稱是Term Frequency and Inverse Document Frequency,是一個用于計算單詞或詞組在在整個文本中出現的幾率。下面是這個公式的表達式:TDIDF (of a term or phrase) = 閱讀全文
posted @ 2011-06-23 19:02
nd
閱讀(2820)
評論(5)
推薦(2)
浙公網安備 33010602011771號