深度學習執行速度不穩定的解決方法

在程序中使用深度學習模型進行檢測時，有時會出現執行速度忽然變慢的問題，其原因可能是當沒有連續執行深度學習方法時，顯卡自動降頻導致的，解決方法如下：

1、在程序中開啟一個新線程用空圖持續執行深度學習方法，這樣可避免顯卡自動降頻。

2、鎖定顯卡頻率（使用nvidia-smi工具）

（1）使用 nvidia-smi -q -d SUPPORTED_CLOCKS 命令查詢顯卡支持的最大頻率，排在最上面的即為顯卡支持的最大頻率。

（2）執行 nvidia-smi -lgc gpuclock 命令將顯卡鎖定到最大頻率，出現All done表示鎖定成功。

鎖定最大頻率后，測試非連續執行深度學習方法，執行速度不再明顯下降，但仍然會有一些波動。

如需解除鎖定，可執行 nvidia-smi --reset-gpu-clocks 命令。

3、配置顯卡的電源管理模式

（1）打開NVIDIA控制面板，左側選擇“管理3D設置”,然后在右側將“電源管理模式”修改為“最高性能優先”，點擊應用按鈕保存配置，修改后需要重啟電腦生效。

（2）重啟電腦后，通過 nvidia-smi 命令可以看到顯卡的性能等級已經從P8變為P0（數字越小等級越高）。

配置顯卡的電源管理模式后，測試非連續執行深度學習方法，發現執行速度不再下降，執行時間波動很小。

3、首次執行深度學習方法很慢的解決方法

在程序中首次執行深度學習方法，發現執行時間很長，解決方法就是在首次執行前對深度學習模塊進行預熱，預熱方法也很簡單，就是用程序先生成一張空圖讓模型先執行一下。

posted @ 2025-02-07 09:27 廣闊之海閱讀(374) 評論(0) 收藏舉報

刷新頁面返回頂部

廣闊之海