<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      語句相似度

      參考鏈接:https://zhuanlan.zhihu.com/p/88938220
      https://blog.csdn.net/yjw123456/article/details/107923566
      https://blog.csdn.net/betterzl/article/details/109983541
      列表的交并差:https://blog.csdn.net/qdPython/article/details/118802922
      jieba的使用:https://blog.csdn.net/lukabruce/article/details/82351742


      import random,jieba

      class Similarity():
      def __init__(self,a,b):
      # 分詞
      self.a = jieba.lcut(a)
      self.b = jieba.lcut(b)
      # 詞袋 a,b的并集
      self.word_bag = list(set(self.a).union(set(self.b)))
      print('詞袋:',self.word_bag)
      # 詞頻
      self.wf1 = self.word_frequency(self.a)
      self.wf2 = self.word_frequency(self.b)
      print('a詞頻:',self.wf1)
      print('b詞頻:',self.wf2)

      # 統計詞頻
      def word_frequency(self,word):
      c = []
      for i in self.word_bag:
      if i in word:
      c.append(1)
      else:
      c.append(0)
      return c
      # 歐氏距離
      def euclidean_distance(self):
      # 統計
      count = 0
      for i, t in enumerate(self.word_bag):
      count += (self.wf1[i] - self.wf2[i]) ** 2
      print('歐氏距離:',1 / (count ** 0.5))
      return 1 / (count ** 0.5)
      # 余弦距離
      def cosine_distance(self):
      # 統計
      count1, count2, count3 = 0, 0, 0
      for i, t in enumerate(self.word_bag):
      count1 += self.wf1[i] * self.wf2[i]
      count2 += self.wf1[i] * self.wf1[i]
      count3 += self.wf2[i] * self.wf2[i]
      print('余弦距離:',count1 / ((count1 ** 0.5) * (count3 ** 0.5)))
      return count1 / ((count1 ** 0.5) * (count3 ** 0.5))
      # Jacard相似度
      def Jacard_distance(self):
      count = 0
      for i in self.a:
      if i in self.b:
      count += 1
      print('Jacard:',count / len(max(self.a, self.b)))
      return count / len(max(self.a, self.b))
      # 海明距離
      def hamming_distance(self):
      c = 0
      for i, t in enumerate(self.word_bag):
      if self.wf1[i] == self.wf2[i]:
      c += 1
      else:
      c += 0
      print('海明距離:',c/len(max(self.a, self.b)))
      return c

      posted @ 2022-08-16 16:15  記錄——去繁就簡  閱讀(56)  評論(0)    收藏  舉報
      主站蜘蛛池模板: 人妻少妇偷人一区二区| 浴室人妻的情欲hd三级国产| 内射干少妇亚洲69xxx| 亚洲第一极品精品无码久久| 久久无码中文字幕免费影院蜜桃| 野外做受三级视频| 精品一区精品二区制服| 国产亚洲欧美在线观看三区| 亚洲精品无码乱码成人| 东京热人妻无码人av| 丰满少妇高潮无套内谢| 麦盖提县| 国产精品无码素人福利不卡| 又色又污又爽又黄的网站| h无码精品3d动漫在线观看| 91精品国产免费人成网站| 亚洲精品综合第一国产综合| 99精品人妻少妇一区二区| 公安县| 色综合五月伊人六月丁香| 成人3D动漫一区二区三区| 国产精品va在线观看无码| 综合色天天久久| 自拍偷拍视频一区二区三区| 亚洲精品乱码久久久久久蜜桃不卡 | 久久99日韩国产精品久久99| 国产美女久久久亚洲综合| 丰满人妻一区二区三区色| 国产精品福利自产拍久久| 97成人碰碰久久人人超级碰oo | 国产一区二区精品久久呦| 人妻少妇久久中文字幕| 中文字幕乱妇无码AV在线| 亚洲午夜亚洲精品国产成人| 丁香婷婷在线观看| 五月天天天综合精品无码| 国产主播精品福利午夜二区| 手机无码人妻一区二区三区免费| 人妻系列无码专区免费 | 国产又色又爽又黄的在线观看| 又黄又爽又色的免费网站|