<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      川山甲

      追求內心的非常平靜!瞬間清空所有的雜念,達到物我兩忘!

        博客園  :: 首頁  ::  :: 聯系 :: 訂閱 訂閱  :: 管理

       

       
      背景
       
      拓展知識圖譜-人物關系模塊,激發用戶興趣點擊,提升流量。
       
       
      要解決的問題
       
      1、識別人名:ner 命名實體識別。
      2、識別兩個人是有關系的;
        人名共現來說明兩個人之間有關系;
        詞向量計算詞與詞之間的相似度來說明兩個人之間關系。
      3、人物關系挖掘。
        兩個人名滿足某種依存模式,則將兩個人名和關系抽取出來。
        用到的相關nlp算子:分詞、詞性標注、命名實體識別(NER)、依存語法分析、語義角色標注
        依存句法中我們所用到的主要關系有:主謂關系(SBV)、動賓關系(VOB)、定中關系(ATT)、并列關系(COO)、介賓關系(POB);
       
      技術方案、基于依存句法的人物關系抽取
       
       
       
       
       
       
      核心工程
       
       
      模式_實例1
       
      兩人名實體同時位于主語,并列關系
      例如:1914年,孔祥熙與宋靄齡于日本結婚。
       
      利用哈工大語言云進行句法分析得到結果如下:
       
       
       
      模式_實例2
       
        兩人名實體同時位于主語,修飾關系。特征詞分別采用角色詞或者人物詞進行不同策略的挖掘。
        例如:鄧超的妻子孫儷也是著名演員。
       
        使用句法分析得到結果如下:
       
       
       
       
       
      模式_實例3
       
        兩人名實體位于賓語,修飾關系
        例如:他的妻子以往被認為是洪秀全的妹妹洪宣嬌。
       

       

       
       
      模式_實例4
       
        兩人名實體分別為主語和賓語,這種情況時,選取謂語動詞作為特征詞。
       
        例如“子路師從孔子”
       
       
       
       
      模式_實例5
       
        關系名為主語、人名2為賓語,這種情況時,選取謂語動詞“是”作為特征詞。
        例如“禹智皓的哥哥是韓國男歌手禹泰云”
       
       
      訓練數據
       

      部分訓練樣本

      金城武在經濟公司的安排下師從歌手陳升
      子路師從孔子
      禹智皓的哥哥是韓國男歌手禹泰云
      賈巴里·帕克的父親桑尼·帕克是前NBA球員   APP
      鄧超的妻子孫儷也是著名演員  APP兩人名實體同時位于主語,修飾關系
      1914年,孔祥熙與宋靄齡于日本結婚    兩人名實體同時位于主語,并列關系
      他的妻子以往被認為是洪秀全的妹妹洪宣嬌  兩人名實體位于賓語,修飾關系
      韓雪在年代武俠劇《葉問》中飾演葉問的妻子張永成
      劉濤共同出演古裝愛情劇《大理公主》飾演貧苦寡婦楊玉姣的女兒楊阿細
      

        

       

       

       

      優化方案
       
        指代消解。針對那些語句中有代詞情況,考慮采用指代消解方案進行優化!
          提高精準度特殊處理方式:
          1、特定關系,必須滿足姓氏相同。如:妹妹、弟弟、哥哥、父親、女兒、兒子、爺爺
          2、語義提取,太依賴于nlp服務本身,在項目中發現,句法分析中出現部分中文詞無法提取出來(這種nlp的句法分析服務暫沒提供自定義詞庫功能);
          3、ner的識別問題,通過增加分詞,并增加一些自定義的分類方式,提高ner的識別度!
       
      數據評估——衡量方法的優劣
       
      1、大多采用準確率和召回率和F1值來衡量方法的優劣。
      2、F1值為準確率和召回率的加權幾何平均值,具體定義如下。
        β是準確率和召回率的相對權重,β= 1,認為兩個指標重要性是相同的;β>1,召回率權更重要一些;β<1時,準確率更重要一些。
       

       

       
      數據評估方式
       
        數據標注:
            1) 先跑出一版數據,然后再數據上做正確的標注;
        評估方式:
            1) 關系挖掘數據評估;
            2) 內鏈數據評估;
         新聞數據評估:
            1) 近似認為與原語料相同,進行數據類挖掘;
       
       
      規則提取特征:
      1) 換行提取
        丘和

       

       2) 單行

      丘行恭

       

       

       
      推薦
       
       
       
      posted on 2018-05-28 10:00  川山甲  閱讀(3824)  評論(4)    收藏  舉報
      主站蜘蛛池模板: 日韩人妻少妇一区二区三区| 男女性高爱潮免费网站| 国产精品剧情亚洲二区| 国产午夜亚洲精品国产成人| 亚洲国产精品一区二区久| 久久天天躁狠狠躁夜夜婷| 谢通门县| 欧美精品国产综合久久| A级孕妇高清免费毛片| 特级做a爰片毛片免费看无码| 性色av一区二区三区精品| 午夜福利精品国产二区| 白嫩少妇bbw撒尿视频| 亚洲中文在线精品国产| 中文字幕无码av不卡一区| 99久久99久久久精品久久| 国产精品 自在自线| 仁怀市| 午夜福利院一区二区三区| 日韩精品久久一区二区三| 无码人妻黑人中文字幕| 亚洲综合91社区精品福利| 久久综合国产一区二区三区| 国产在线中文字幕精品| 国产区成人精品视频| 久久一区二区三区黄色片| 国产精品成人99一区无码| 精品国产综合成人亚洲区| 亚洲春色在线视频| 一区二区三区无码视频免费福利| 亚洲精品成人区在线观看| 青青国产揄拍视频| 思茅市| 乱人伦人妻中文字幕不卡| 久久亚洲精品中文字幕波多野结衣 | 亚洲激情一区二区三区在线| 囯产精品久久久久久久久久妞妞 | 免费国精产品wnw2544| 午夜欧美精品久久久久久久| gogo无码大胆啪啪艺术| 无码av中文一区二区三区桃花岛|