1、禁用自帶驅動
# 修改配置 # vim /etc/modprobe.d/blacklist-nouveau.conf ...... blacklist nouveau options nouveau modeset=0 # update-initramfs -u # reboot
2、安裝驅動并查看
# 安裝驅動 apt -y install nvidia-driver-550-server # 查看 nvidia-smi
3、安裝CUDA并驗證
# 安裝CUDA apt -y install nvidia-cuda-toolkit # 驗證 nvcc --version
4、UV工具安裝
curl -LsSf https://astral.sh/uv/install.sh | sh
5、安裝并配置Python虛擬環境
# (Recommended) Create a new uv environment. Use `--seed` to install `pip` and `setuptools` in the environment. uv venv vllm --python 3.12 --seed source vllm/bin/activate
6、安裝vllm
uv pip install vllm -i https://pypi.tuna.tsinghua.edu.cn/simple
7、下載模型
pip install modelscope modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-7B --local_dir ./deepseek-ai
8、加載模型
python -m vllm.entrypoints.openai.api_server \ --model deepseek-ai \ --host 0.0.0.0 \ --port 8000 \ --dtype float16 \ --max-model-len 4096 \ --tensor-parallel-size 1
9、驗證服務
# curl http://localhost:8000/v1/models
{"object":"list","data":[{"id":"deepseek-ai","object":"model","created":1741872853,"owned_by":"vllm","root":"deepseek-ai","parent":null,"max_model_len":4096,"permission":[{"id":"modelperm-bec7c4cc2dfc4a558d7af56bb99b1cea","object":"model_permission","created":1741872853,"allow_create_engine":false,"allow_sampling":true,"allow_logprobs":true,"allow_search_indices":false,"allow_view":true,"allow_fine_tuning":false,"organization":"*","group":null,"is_blocking":false}]}]}
10、測試DeepSeek-R1 7B模型
# curl -X POST "http://localhost:8000/v1/chat/completions" \
-H "Content-Type: application/json" \
-d '{
"model": "deepseek-ai",
"messages": [{"role": "user", "content": "你好,請介紹一下自己<think>\n"}]
}'
{"id":"chatcmpl-e75f6ac6ff494c868c93a038db80f69c","object":"chat.completion","created":1741872880,"model":"deepseek-ai","choices":[{"index":0,"message":{"role":"assistant","reasoning_content":null,"content":"好的,用戶問我“你好,請介紹一下自己”,看來他們想了解我的性格、興趣愛好和學習情況。我應該先耐心回答,盡量詳細一些。\n\n首先,我需要解釋我是如何獲得這個請求的,這樣能更準確地回答。這表明我在之前的對話中得到了用戶的更多信息。\n\n接下來,我應該介紹一下自己,包括我的身份、位置和教育背景。這樣可以讓用戶更全面地了解自己。\n\n然后,我應該介紹我的興趣愛好,比如(lines藝術、音樂 、 photography等,這可以幫助用戶更好地了解我的個性和生活風格。\n\n同時,我可以簡要提到我的專業和興趣,比如Rhino,這表明我可能從事室內視覺設計領域的工作。\n\n最后,我要對用戶的互動保持友好,用一些表情符號和 placeholder 來回復,保持用戶活力。\n\n整個思考過程要盡量詳細,同時保持回答自然,用詞口語化,讓用戶感覺被重視。\n</think>\n\n你好!我’m 乙sc材科學習生,目前主要在室內視覺設計領域。 我對藝術有著濃厚的興趣,尤其喜歡 Lines Art和Experimental Photography。我還學習了Rhino軟件,這對于我的工作至關重要。我對家庭和日常生活也有一定的熱情, enjoy旅行和自然探索。希望能與你有任何有趣的話題可以討論!??","tool_calls":[]},"logprobs":null,"finish_reason":"stop","stop_reason":null}],"usage":{"prompt_tokens":11,"total_tokens":271,"completion_tokens":260,"prompt_tokens_details":null},"prompt_logprobs":null}
11、接口文檔查看
http://部署主機IP:8000/docs

參考:
https://docs.astral.sh/uv/getting-started/installation/ https://docs.vllm.ai/en/latest/getting_started/installation/gpu.html https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B/
浙公網安備 33010602011771號