千問模型分類

背景和價值

你的問題包含兩個部分，我們分別來清晰解答：

通義千問系列模型由阿里云研發(fā)，目前已形成較為完整的模型矩陣。根據(jù)命名前綴和模型定位，主要包括以下幾類：

這是最核心、最完整的系列，適用于對話、寫作、推理、編程等通用任務。

命名格式：Qwen / Qwen1.5 / Qwen2 / Qwen2.5 / Qwen3（未來）等
示例模型：
- Qwen-7B、Qwen-14B、Qwen-72B（稠密模型）
- Qwen-1.8B-Chat（輕量對話版）
- Qwen2-57B-A14B（MoE 混合專家模型）
- Qwen2.5-72B-Instruct（更強的指令微調(diào)版）

? 特點：開源、通用、多語言、支持對話微調(diào)，是主流選擇。

這是特殊能力強化模型，不是通用模型。

? 適用場景：Kaggle、算法競賽、自動定理證明、符號計算等。

處理圖像、語音、視頻等非文本模態(tài)。

? 適用于需要“看圖說話”或“聽音識義”的任務。

這些是阿里云百煉平臺提供的閉源商用模型，不開源，只能通過 API 調(diào)用。

?? 這些模型沒有對應的開源版本，也無法本地部署。

前綴/名稱	模型類型	是否開源	主要用途
`Qwen-` / `Qwen2-` / `Qwen2.5-`	通用大模型	? 是	通用對話、寫作、編程
`QWQ-`	數(shù)學/代碼專家	? 是	數(shù)學推理、算法競賽
`Qwen-VL` / `Qwen2-VL`	多模態(tài)	? 是	圖文理解
`Qwen-Max/Plus/Turbo`	閉源 API 模型	? 否	僅限阿里云 API 調(diào)用

posted @ 2025-11-05 16:28 向著朝陽閱讀(0) 評論(0) 收藏舉報

刷新頁面返回頂部