深度學習執行速度不穩定的解決方法
在程序中使用深度學習模型進行檢測時,有時會出現執行速度忽然變慢的問題,其原因可能是當沒有連續執行深度學習方法時,顯卡自動降頻導致的,解決方法如下:
1、在程序中開啟一個新線程用空圖持續執行深度學習方法,這樣可避免顯卡自動降頻。
2、鎖定顯卡頻率(使用nvidia-smi工具)
(1)使用 nvidia-smi -q -d SUPPORTED_CLOCKS 命令查詢顯卡支持的最大頻率,排在最上面的即為顯卡支持的最大頻率。

(2)執行 nvidia-smi -lgc gpuclock 命令將顯卡鎖定到最大頻率,出現All done表示鎖定成功。

鎖定最大頻率后,測試非連續執行深度學習方法,執行速度不再明顯下降,但仍然會有一些波動。
如需解除鎖定,可執行 nvidia-smi --reset-gpu-clocks 命令。
3、配置顯卡的電源管理模式
(1)打開NVIDIA控制面板,左側選擇“管理3D設置”,然后在右側將“電源管理模式”修改為“最高性能優先”,點擊應用按鈕保存配置,修改后需要重啟電腦生效。

(2)重啟電腦后,通過 nvidia-smi 命令可以看到顯卡的性能等級已經從P8變為P0(數字越小等級越高)。

配置顯卡的電源管理模式后,測試非連續執行深度學習方法,發現執行速度不再下降,執行時間波動很小。
3、首次執行深度學習方法很慢的解決方法
在程序中首次執行深度學習方法,發現執行時間很長,解決方法就是在首次執行前對深度學習模塊進行預熱,預熱方法也很簡單,就是用程序先生成一張空圖讓模型先執行一下。

浙公網安備 33010602011771號