Ubuntu問題匯總ing...
|
本節將總結平常Ubuntu18.04系統出現的一系列問題,(本人單系統)目前問題有:nvidia-smi失敗... |
1.nvidia-smi顯示失敗
? 在風和日麗的一天上午,打開實驗室電腦,竟然發現電腦桌面圖標變大了?。?!【口吐芬芳...】并且終端輸入nvidia-smi顯示:
NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.
? 此時我們還可以發現,GPU無法使用,只能使用CPU,正值要跑程序。。。對于類似這種偏“硬件”的問題,腦闊疼?。?!終端輸入:
nvcc -V
發現cuda存在,有的人說這是看驅動,系統操作小白的我一臉懵逼,完全不清楚這個操作到底是干嘛的,跟著別人照葫蘆畫瓢就行(手動狗頭)。
? 個人估摸應該是系統自動更新了驅動問題,接下來有很多人建議:更新驅動、內核降低,本文在此總結一下我個人的解決方法,見(2):
(1)首先是常規操作,有很多人用了以下操作:
? 參考:知乎文章
sudo apt install dkms
sudo dkms install -m nvidia -v 418.87.00
# 418.87.00為之前安裝 nvidia 驅動的版本號,可通過ls /usr/src | grep nvidia查詢
? 然而,對于本人并沒有用。
(2)降低內核
sudo gedit /etc/default/grub # 修改并保存
sudo update-grub # 更新一下
# 重啟
? 修改圖1中紅點兩行,保存并退出
-
GRUB_TIMEOUT_STYLE=hidden注釋掉,即可在開機時顯示Grub引導界面;
-
GRUB_TIMEOUT=5,設置引導界面的停留時間,單位:秒。

? 重啟后,我們就可以進入Grub引導界面,如圖2,可進入--》Ubuntu高級選項,選擇相應的內核版本,降低內核以匹配驅動版本。
? 這時候再在終端輸入nvidia-smi即可顯示內存GPU等信息。

? 注意:上述這種方法,每次進入都需要選擇內核版本,有一部分人,直接對圖1種GRUB_DEFAULT進行操作,例如:GRUB_DEFAULT=“1> 3”,其中在Grub引導界面 中選擇第2個選項(索引1),在子菜單中選擇第四個選項(索引3)。這樣就不用每次都選擇。
? 這個。。。。偷懶一下,后面等不用代碼的時候,試一下,主要是索引的問題,需要確認一下,因為網上有人搞崩了,瑟瑟發抖,本人還是手動操作先。大家可以參考https://support.huaweicloud.com/trouble-ecs/ecs_trouble_0327.html, 我還沒有去實踐。

浙公網安備 33010602011771號