<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      SSIS高級轉換任務—模糊分組

        

      在模糊查找中我們提到臟數據是怎樣進入到表中的事情,主要還是由于一些“Lazy-add”造成的。這種情況我們的肉眼很容易被欺騙,看上去是同一個單詞,其實就差那么一個字母,變成了兩個不同的單詞。一個簡單的例子是X-Ray Tech和xRey,我們很有可能認為他們是同一個職務,CT操作員,但是如果讓計算機來處理的話,它們是兩種截然不同的東西。

        

      和模糊查找一樣,模糊分組可以查找出多行中出現的類似的單詞進行歸類。我們可以使用這些歸類得到的結果清洗數據源或者在不修改基礎數據的情況下對原表進行修改。模糊分組也需要一個輸入字符流,還需要一個OLE DB數據連接,用于存放分析得到的結果。

      模糊分組任務的編輯界面有下面三個標簽

      • 連接管理:這個標簽用來設置OLE DB連接,在這個連接的數據庫中存放分組結果,這個標簽和前面提到的是一樣的效果
      • 列:這個標簽顯示輸入流中的列,在這里需要選擇一些需要進行模糊分組的列,如圖1。每一個被選中的列將會被分析,產生一些新的結果列。如果沒有選擇的話,這些列將會被標記為PassThrow列,意思是不進行模糊分組,直接將導出到輸出流中。在這里也可以根據自己的意愿修改Group Output Alias,Output Alias,CleanMatch和Similarity Alias的名字。Numerals選項,如圖2,這個選項有前導,后導,前導和后導,不用前導后導,四個選項。在對類似地址的一些數據進行模糊分組的時候這個選項會很有用。最后有一個Comparison flags選項可以設置忽略大小寫,忽略符號等設置。

        圖1

        圖2
          
      • 高級:這個標簽選項中可以設置與模糊分組算法有關的選項。在這里可以修改將要派生的三個列的列名,默認情況下它們分別是“_key_out”,“_key_in”,“_score”。下面的Similarity threshold可以控制相似度,默認的值是0.5。分隔符選項中可以設置忽略輸入字符流中的“.”或空字符等,默認情況下會忽略所有常見字符。如圖3。

        圖3

        

      下面我們做一個例子來說明模糊分組的用法。假設人事部門在輸入每個員工的職位信息的時候會有一些筆誤,這里我們使用模糊分組來得到最標準的職位名稱和每個員工的職位和這個標準的名稱的相似度。

      1. 創建一個package命名為FuzzlyGroupExample.dtsx,在Control Flow界面中拖放一個Data Flow任務,雙擊進入Data Flow界面
      2. 下載下面的txt文件,命名為empdata.txt,存放在一個本地路徑里。下載文件
      3. 3. 添加一個平面文件連接,命名為EmployeeData,連接上面創建的txt文件。設置Format屬性為Ragged Right,設置第一行為列名,點擊列邊界分別在第5個字符和第28個字符處點擊放置兩個分割線如圖4。點擊高級標簽設置TITLE的OutputColumnWidth為50,保存連接。

        圖4
      4. 添加一個在Data Flow中拖放一個平面文件數據源,連接路徑設置為上述文件。添加一個OLE DB數據目的。
      5. 打開OLE DB數據目的,創建一個連接,連接本地AdventureWorkers數據庫。
      6. 添加一個模糊分組任務,作為平面文件數據源和OLE DB數據目的的中間任務連接起來。
      7. 如上圖1,選擇TITLE列作為輸入列,其他選項默認。
      8. 在高級標簽界面中,選擇相似度為默認0.5,這里都默認設置選項。
      9. 打開OLE DB數據目的,點擊Name of Table or View,創建一個新的表,命名為[FuzzyGrouping],點擊Mapping標簽,保留默認設置。
      10. 在模糊分組任務和數據目的之間添加一個DataViewer,選擇類型為grid。運行這個package,DataViewer如圖5。 最后運行解雇如圖6。

        圖5

        圖6

        

      最后我們查看結果EXECUTIVE VICE PRESIDEN,EXEC VP, FLDS OPS MGR , FIELDS OPERATIONS MANAG, X-RAY TECH被認為是標準數據,其他數據和他們做模糊比較。如圖7。


      圖7

      posted @ 2011-07-04 22:21  nd  閱讀(2498)  評論(2)    收藏  舉報
      主站蜘蛛池模板: 久久精品国产午夜福利伦理| 日韩欧美aⅴ综合网站发布| 一卡二卡三卡四卡视频区| 国产精品一区二区三区性色| 一区二区福利在线视频| 國產尤物AV尤物在線觀看| 国产精品天堂蜜av在线播放| 亚洲色偷偷色噜噜狠狠99| 久久国产成人亚洲精品影院老金| 日本丰满护士bbw| 强奷漂亮雪白丰满少妇av| 99在线精品国自产拍中文字幕| 2019nv天堂香蕉在线观看| 中文字幕人妻丝袜美腿乱| 久久精品夜色噜噜亚洲aa| 亚洲中文字幕在线无码一区二区| 国产国产午夜福利视频| 成av免费大片黄在线观看| 91亚洲人成手机在线观看| 亚洲精品漫画一二三区 | 亚洲中文字幕无码专区| 国产第一页浮力影院入口| 国产高清在线精品一本大道| 2019国产精品青青草原| 无码av中文一区二区三区桃花岛| 小伙无套内射老熟女精品| 另类专区一区二区三区| 粗了大了 整进去好爽视频| 蜜臀在线播放一区在线播放| 欧美日韩精品一区二区视频| 精品国产一区二区三区av片| 天天干天天干| 国产中文字幕日韩精品| 少妇午夜啪爽嗷嗷叫视频| 亚洲在av极品无码天堂| 国产性色的免费视频网站| 宁武县| 中文字幕第一页亚洲精品| 日本欧美一区二区三区在线播放| 亚洲伊人成无码综合网| 深夜福利成人免费在线观看|