你應該懂的AI大模型（二）之大模型技術架構

?

一、行業(yè)變化

Software is eating the world，but AI is going to eat software！

“軟件正在吞噬世界” 這一觀點由網(wǎng)景公司創(chuàng)始人馬克?安德森在 2011 年提出，意味著軟件在當今社會的各個領域發(fā)揮著至關重要的作用，極大地改變了人們的生活和工作方式。但是現(xiàn)在 AI 技術的崛起再次改變我們的生活。作為軟件行業(yè)從業(yè)者這是我們要關注的。

二、從一個開發(fā)需求展開

需求：如果要做分析公司銷售人員的成交情況

傳統(tǒng)實現(xiàn)：根據(jù)公司銷售人員的成交情況報表，需要做一個web頁面，如果有既有系統(tǒng)則需要在既有系統(tǒng)上進行二次開發(fā)；

大模型實現(xiàn)：通過自然語言給大模型下分析的命令，大模型從數(shù)據(jù)庫中調用數(shù)據(jù)后組裝成頁面或者數(shù)據(jù)進行輸出。

從上述實現(xiàn)的差別我們分析得出：
傳統(tǒng)實現(xiàn)：關注的是技術實現(xiàn)，如開發(fā)語言、開發(fā)框架、中間件；

大模型實現(xiàn)：相當于調用一個人，對大模型“說人話”，大模型能聽懂“人話”，能直接給出結果，雖然這個結果不一定對。這就是大模型應用的最終要義：把大模型當人看。

人在處理問題時的步驟是：

1、領導通過口頭或者文字向我們下達任務；

2、我們接到任務后發(fā)現(xiàn)我們沒有接觸過相關知識，我們需要現(xiàn)學新的知識或者技術；

3、由于對新知識的不熟悉，在實踐中很容易出錯，我們就會想辦法更深入的學習和理解這部分知識，避免出錯；

4、有了扎實的知識我們開始著手開干時，發(fā)現(xiàn)其他部門有我們需要的資料或數(shù)據(jù)，我們就會想辦法獲取這些資料數(shù)據(jù)來更好的完成我們的工作；

5、最后，我們完成這項工作后會把工作成果留存下來，比如做了一個很復雜的excle 表，里面的公式和數(shù)據(jù)調用關系在我們下次使用時直接輸入數(shù)值就能直接出結果了。

以上是人在處理問題時“把大模型當人看”，讓我們類比一下大模型處理問題的鏈條：

1. Prompt Engineering（提示工程）：定義問題輸入與引導模型輸出

簡單講就是問題的初始化與輸出控制，比如我們問大模型如何煮咖啡，大模型能清楚的在500字以內說清楚如何煮咖啡，而不是胡說八道無關的內容。

類比人類處理問題的步驟就是領導給我們下達一個我們能聽懂的任務，并且我們知道最后要給領導一個什么東西。

2.RAG（檢索增強生成）：補充外部知識與事實依據(jù)

比如大模型的知識是到 24 年的，如果我問它關于 25 年中美貿易戰(zhàn)的情況，它肯定回答不好，這時就需要通過RAG去外部知識庫檢索 25 年中美貿易戰(zhàn)的相關時間脈絡、事件關鍵人物、事件影響評論等等信息，輔助大模型生成有價值的回答或者建議。

類比人類處理問題就是領導安排我做一個公司 25 年去 XX 地團建的規(guī)劃，那我要去查 25 年最新的該地的景點開放情況、交通情況，只有知道這些最新的數(shù)據(jù)做出的規(guī)劃才是準確的。

此外 RAG在多跳推理（需整合多源信息）或長文本生成（如報告、論文）中，RAG 提供結構化知識，降低模型 “幻覺” 風險。

3. Fine-tuning（微調）：適配特定任務與領域

模型微調就是模型能力的定向優(yōu)化，舉例說明：在醫(yī)療、金融等專業(yè)性比較強的領域通過模型的微調能更好處理任務，避免通用模型的語義模糊，比如問醫(yī)療大模型可以清除的分辨“流感”與感冒的區(qū)別，而通用大模型就很容易將二者混淆。

4. Function Calling（函數(shù)調用）：擴展模型執(zhí)行能力

這是模型鏈接外部工具與服務的能力，用來執(zhí)行模型無法直接完成的任務，比如我們問大模型北京南站的高鐵時刻表，這時大模型就需要調用 12306 的接口實現(xiàn)。

通過 Function Calling 可以將自然語言指令轉為具體的行動，比如我們告訴大模型“給我畫一朵花”，大模型調用圖像生成函數(shù)。我們告訴大模型“幫我計算 1999+12121”，模型調用計算工具返回結果。

最后我們也能看出來，如果我們不基于業(yè)務，單單只把大模型做成問答類的工具，是很難實際落地并且變現(xiàn)的。

5. Agent（智能體）：協(xié)調多步任務與自主決策

Agent 是一種能夠感知環(huán)境并自主決策的實體。它可以是軟件程序，也可以是硬件設備，甚至是虛擬的數(shù)字存在。Agent 具備自主性、環(huán)境感知能力和決策執(zhí)行能力，能夠根據(jù)環(huán)境的變化自動調整行為，以實現(xiàn)特定的目標。與傳統(tǒng) AI 不同，Agent 不僅僅是執(zhí)行單一任務的工具，它更像是一個智能的合作伙伴，能夠在復雜的環(huán)境中進行靈活的決策和交互。這種特性使得 Agent 在現(xiàn)代科技中占據(jù)了核心地位，成為實現(xiàn)智能化、自動化的關鍵技術。Agent的主要作用如下：

分解復雜任務：將多步驟問題（如 “預訂沈陽到上海的機票并安排接送機”）拆解為子任務（查詢航班、比較價格、調用預訂 API、發(fā)送確認信息），按邏輯順序執(zhí)行。

動態(tài)選擇工具：根據(jù)任務需求，自主決定是否使用 RAG 檢索、Function Calling 調用工具，或切換不同模型（如文本生成模型與圖像模型協(xié)作）。

處理環(huán)境反饋：在交互過程中，根據(jù)外部工具返回結果（如 “航班已滿”）調整策略（如推薦備選航班），實現(xiàn)閉環(huán)決策。

模擬人類流程：在業(yè)務自動化（如客服工單處理、數(shù)據(jù)分析報告生成）中，Agent 遵循預設規(guī)則或自主學習策略，完成需要多模塊協(xié)作的復雜任務。

例如我們告訴大模型： “制定沈陽三日旅游計劃并預訂酒店”，Agent 先通過 RAG 檢索景點信息，再用 Function Calling 預訂酒店，最后整合信息生成計劃，全程無需人工干預。

本文旨在掃盲大模型技術的技術架構名詞，并未涉及具體運用的技術，此類內容及大模型的核心算法知識筆者爭取在后續(xù)的文章中逐步講全。

?

posted @ 2025-06-14 16:07 BricheersZ 閱讀(103) 評論(0) 收藏舉報

刷新頁面返回頂部

BricheersZ

你應該懂的AI大模型（二） 之 大模型技術架構