<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      容器中pytorch的cpu速度很慢,原因找到了

      • 容器中pytorch的cpu速度很慢,原因找到了
      # import numpy as np
      # import time
      # import torch
      # import os
      
      # os.environ['OMP_NUM_THREADS'] = '8'  # 增加線程數
      # torch.set_num_threads(8)  # 設置PyTorch線程數
      
      # # 創建測試矩陣
      # device = 'cuda' if torch.cuda.is_available() else 'cpu'
      # print(f"使用設備: {device}")
      # B = torch.randn(2000, 2000).to(device)  # 使用GPU
      
      # # 預熱GPU
      # if device == 'cuda':
      #     _ = torch.svd(torch.randn(100,100).to(device))
      
      # # 計時SVD
      # start = time.time()
      # with torch.no_grad():  # 禁用梯度計算
      #     x = torch.svd(B)
      # end = time.time()
      
      # print(f"SVD耗時: {end - start:.2f}秒")
      
      import time
      import numpy as np
      import torch
      import os
      
      def diagnose_torch_svd():
          print("=== PyTorch SVD性能診斷 ===")
          
          # 1. 檢查系統配置
          print("\n1. 系統配置:")
          print(f"PyTorch線程數: {torch.get_num_threads()}")
          print(f"PyTorch interop線程數: {torch.get_num_interop_threads()}")
          print(f"OMP_NUM_THREADS: {os.environ.get('OMP_NUM_THREADS', '未設置')}")
          print(f"MKL_NUM_THREADS: {os.environ.get('MKL_NUM_THREADS', '未設置')}")
          
          # 2. 創建測試數據
          print("\n2. 性能測試:")
          size = 1000
          numpy_array = np.random.randn(size, size).astype(np.float64)
          torch_tensor = torch.from_numpy(numpy_array.copy())
          
          # 3. NumPy基準
          start = time.time()
          U_np, s_np, Vt_np = np.linalg.svd(numpy_array, full_matrices=False)
          numpy_time = time.time() - start
          
          # 4. PyTorch測試
          start = time.time()
          U_pt, s_pt, Vt_pt = torch.svd(torch_tensor, some=True)
          torch_time = time.time() - start
          
          print(f"NumPy SVD: {numpy_time:.4f}s")
          print(f"PyTorch SVD: {torch_time:.4f}s")
          print(f"速度比: {torch_time/numpy_time:.2f}x")
          
          # 5. 優化建議
          print("\n3. 優化建議:")
          if torch_time > 2 * numpy_time:
              print("??  PyTorch SVD明顯慢于NumPy,建議:")
              print("   - 設置 torch.set_num_threads(4)")
              print("   - 檢查環境變量 OMP_NUM_THREADS 和 MKL_NUM_THREADS")
              print("   - 考慮對大型矩陣使用NumPy后端")
          else:
              print("? PyTorch SVD性能正常")
      
      # 運行診斷
      # diagnose_torch_svd()
      
      # 優化后重新測試
      print("\n" + "="*50)
      print("應用優化后:")
      
      # 應用優化
      # os.environ['OMP_NUM_THREADS'] = '4'
      # os.environ['MKL_NUM_THREADS'] = '4'
      torch.set_num_threads(8)
      
      diagnose_torch_svd()
      
      posted @ 2025-11-05 16:57  bregman  閱讀(4)  評論(0)    收藏  舉報
      主站蜘蛛池模板: 成人做受120秒试看试看视频| 亚洲国产成人久久精品不卡| 国产成人综合亚洲第一区| 久久精品人人做人人爽97| 中文字幕国产精品专区| 亚洲春色在线视频| 久久经精品久久精品免费观看| 周至县| 欧美片内射欧美美美妇| 亚洲精品国模一区二区| 国产精品久久久福利| 国产精品香港三级国产av| 亚洲区成人综合一区二区| 亚洲天堂av在线一区| 国产中文字幕在线精品| 中文字幕乱码人妻综合二区三区| 一区二区在线欧美日韩中文| 韩国无码AV片午夜福利| 成人午夜在线观看日韩| 无码人妻一区二区三区兔费| 波多野结av衣东京热无码专区| 日韩卡一卡2卡3卡4卡| 公喝错春药让我高潮| 色午夜一av男人的天堂| 99在线 | 亚洲| 在线播放亚洲成人av| 久久精品成人无码观看免费| 日韩成av在线免费观看| 精品不卡一区二区三区| 泸西县| 女人腿张开让男人桶爽| 精品国际久久久久999波多野| 亚洲成人av在线资源| 欧美国产日韩在线三区| 色爱综合另类图片av| 国产AV福利第一精品| 国产伦精品一区二区三区| 国产精品毛片一区二区| 日韩深夜福利视频在线观看| 你拍自拍亚洲一区二区三区| 日本三级香港三级三级人妇久|