<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      python 中文亂碼解決方案

      python 處理文字內(nèi)容時(shí),常常遇到編碼的問(wèn)題。

      漢字常用的兩種編碼方式為 utf8 和 gbk,解析一個(gè) txt 文件或者一個(gè)字符串時(shí)經(jīng)常會(huì)遇到編碼問(wèn)題。

      對(duì)于一行文本,我們分別嘗試用 utf8 或者 gbk 去解碼,哪一個(gè)解碼內(nèi)容多選擇哪一個(gè)

      def force_decode(string:bytes) ->str:
          """
          sometimes neither gbk nor gbk can decode succseefully from string
          select longger decode result from utf8 or gbk
          """
          if not isinstance(string, bytes):
              raise ValueError('expected bytes array')
          decode_chars_count = []
          for i in ['utf8', 'gbk']:
              try:
                  return string.decode(i)
              except UnicodeDecodeError as ex:
                  decode_chars_count.append(ex.start)
          # neither utf8 or gbk decode successfully
          # select the longer decode one
          utf8_len, gbk_len = decode_chars_count
          selected_encoding = 'utf8' if utf8_len > gbk_len else 'gbk'
          return string.decode(selected_encoding, errors='ignore')

       

      代碼鏈接:https://gist.github.com/albertofwb/b53bf32adca5c245c6dee6642ca5463d

      posted @ 2020-06-24 16:46  SurfUniverse  閱讀(332)  評(píng)論(0)    收藏  舉報(bào)
      主站蜘蛛池模板: 亚洲欧美日韩愉拍自拍美利坚| 国产在线拍揄自揄拍无码视频| 久热这里有精品视频在线| 江安县| 日韩精品一卡二卡三卡在线| 亚洲色大成网站WWW永久麻豆| 国产成人a在线观看视频免费 | 日韩在线视频一区二区三区| 久久99九九精品久久久久蜜桃| 国产午夜福利精品片久久| 科技| 高潮潮喷奶水飞溅视频无码| 国产午夜精品久久精品电影| 久久碰国产一区二区三区| 久久亚洲精品11p| 精品国产一区二区三区av片| 国产高清亚洲一区亚洲二区| 韩国无码AV片午夜福利| 国产精品久久久久影院亚瑟| 国产精品一区在线蜜臀| 亚洲欧美国产精品专区久久| 日韩av一区二区高清不卡| 无码AV无码免费一区二区| 免费AV片在线观看网址| 米奇亚洲国产精品思久久| 亚洲色欲在线播放一区二区三区| 久爱无码精品免费视频在线观看| 麻豆国产va免费精品高清在线| 无码熟妇人妻av影音先锋| 日本欧美大码a在线观看| 成人乱人乱一区二区三区| 激情国产一区二区三区四区| 亚洲日韩国产成网在线观看| 国内精品人妻一区二区三区 | 四虎库影成人在线播放| 亚洲人成网线在线播放VA| 色悠悠国产精品免费观看| 激烈的性高湖波多野结衣| 亚洲人成绝网站色www| 亚洲精品无码久久一线| 无码一区二区三区av在线播放|