DeepSeek 使用技巧

推理模型與指令模型
推理模型和指令模型是兩類不同的人工智能模型,分別側重于邏輯推理和任務執行。以下是它們的簡單介紹:
1. 推理模型
- 目標:解決邏輯推理、數學計算或知識推斷問題,輸出確定性結論。
- 特點:
- 強調邏輯鏈推導,適合結構化問題(如數學題、物理公式推導)。
- 輸出通常為數值、分類結果或明確的推理步驟。
- 典型應用:
- 數學解題(如AlphaGeometry解幾何題)。
- 科學計算(如分子結構預測)。
- 邏輯推理(如定理證明)。
- 示例模型:
- AlphaGo:通過推理策略選擇最佳下棋步驟。
- Lean:交互式定理證明器。
2. 指令模型
- 目標:理解并執行用戶指令,生成符合要求的動態響應或操作。
- 特點:
- 依賴自然語言輸入(如“寫一首詩”“生成代碼”)。
- 輸出多樣化(文本、代碼、圖像等),強調與用戶意圖對齊。
- 典型應用:
- 對話系統(如ChatGPT)。
- 編程輔助(如GitHub Copilot生成代碼)。
- 內容創作(如生成文章、設計文案)。
- 示例模型:
- GPT-4:根據指令生成文本、代碼等。
- Claude:通過自然語言指令完成復雜任務。
3. 核心區別
| 維度 | 推理模型 | 指令模型 |
|---|---|---|
| 目標 | 解決邏輯問題,輸出確定性結論。 | 執行用戶指令,生成動態響應。 |
| 輸入 | 結構化問題(如數學題)。 | 自然語言指令(如“寫一首詩”)。 |
| 輸出 | 數值、分類結果或推理步驟。 | 多樣化內容(文本、代碼、圖像)。 |
| 典型應用 | 數學解題、科學計算。 | 對話系統、編程輔助、內容創作。 |
總結
- 推理模型:擅長邏輯推導,適合解決結構化問題。
- 指令模型:擅長任務執行,適合處理開放式指令。
兩者常結合使用(如用指令模型接收問題,調用推理模型生成答案),以實現更強大的AI能力。
理解大語言模型的本質
特點1:大模型在訓練時是將內容token 化的,大模型所看到的和理解的世界與你不一樣

特點2: 大模型知識是存在截至時間的

特點3:大模型缺乏自我認知/自我意識
特點4:記憶有限(64k/128k)
如下上傳一本紅樓夢,DeepSeek 會通過RAG 方式去讀取,但是不會讀取紅樓夢的所有內容

特點5:輸出長度有限(4K/8K)
可以先讓大模型列出提綱,然后再按提綱分別寫作
有效的7大R1 使用技巧
技巧1:提出明確的要求
技巧2: 要求特定的風格

技巧3:提供處分的任務背景信息

技巧4:主動標注自己的知識狀態

技巧5:定義目標,而非過程

技巧6:提供AI不具備的知識背景
技巧7:從開放到收斂
也就是關注R1的輸出結果時的推理信息,其中可能會包含自己沒有考慮到的內容,最好加入到prompt 中,不要讓R1 去猜測
本文來自博客園,作者:chuangzhou,轉載請注明原文鏈接:http://www.rzrgm.cn/czzz/p/18697972

浙公網安備 33010602011771號