加速智能體開(kāi)發(fā):從 Serverless 運(yùn)行時(shí)到 Serverless AI 運(yùn)行時(shí)

本文整理自 2025 云棲大會(huì),阿里云智能集團(tuán)產(chǎn)品專(zhuān)家,洪曉龍演講議題《函數(shù)計(jì)算:AI 時(shí)代的最佳運(yùn)行時(shí)》
在云計(jì)算與人工智能深度融合的背景下,Serverless 技術(shù)作為云原生架構(gòu)的集大成者,正加速向AI原生架構(gòu)演進(jìn)。阿里云函數(shù)計(jì)算(FC)率先提出并實(shí)踐“Serverless AI 運(yùn)行時(shí)”概念,通過(guò)技術(shù)創(chuàng)新與生態(tài)聯(lián)動(dòng),為智能體(Agent)開(kāi)發(fā)提供高效、安全、低成本的基礎(chǔ)設(shè)施支持。本文從技術(shù)演進(jìn)路徑、核心能力及未來(lái)展望三方面解析 Serverless AI 的突破性?xún)r(jià)值。
一、從 Serverless 到 Serverless AI :技術(shù)演進(jìn)的必然選擇
在 AI 時(shí)代,Serverless 正經(jīng)歷從 Serverless 到 Serverless AI 的進(jìn)化。這一轉(zhuǎn)變是由于 AI 應(yīng)用對(duì)基礎(chǔ)設(shè)施的新要求,包括圍繞 Agent 為中心的開(kāi)發(fā)范式變化、狀態(tài)持久化需求、任務(wù)驅(qū)動(dòng)協(xié)作方式以及容錯(cuò)自愈能力等四個(gè)主要方面。AI 原生范式下,Agent 的開(kāi)發(fā)方式從服務(wù)化或 API 為中心轉(zhuǎn)向以 Agent 為核心,且要求基礎(chǔ)設(shè)施支持多樣化任務(wù)、彈性擴(kuò)展、數(shù)據(jù)隔離安全特性及主動(dòng)任務(wù)協(xié)同調(diào)用方式。
AI 原生應(yīng)用開(kāi)發(fā)的四大核心需求

- Agent 中心化開(kāi)發(fā)范式
- 傳統(tǒng) API 驅(qū)動(dòng)模式已無(wú)法滿足 Agent 自主決策、主動(dòng)執(zhí)行任務(wù)的需求。AI 原生開(kāi)發(fā)需圍繞 Agent 生命周期設(shè)計(jì),強(qiáng)調(diào)任務(wù)驅(qū)動(dòng)協(xié)作而非被動(dòng)響應(yīng)。
- 狀態(tài)持久化支持
- Agent 需保存對(duì)話記憶、人格設(shè)定等狀態(tài)信息,要求基礎(chǔ)設(shè)施原生支持狀態(tài)管理,避免依賴(lài)外部存儲(chǔ)組件。
- 動(dòng)態(tài)任務(wù)執(zhí)行能力
- Agent 需執(zhí)行代碼、瀏覽器操作、工具調(diào)用等多樣化任務(wù),運(yùn)行時(shí)需具備輕量化、強(qiáng)擴(kuò)展性,適配不可預(yù)測(cè)的流量模式。
- 容錯(cuò)與自愈機(jī)制
- 面對(duì)大模型生成代碼的不確定性,需從防御性編程轉(zhuǎn)向運(yùn)行時(shí)自愈能力,降低安全風(fēng)險(xiǎn)對(duì)開(kāi)發(fā)效率的影響。
技術(shù)架構(gòu)對(duì)比:Serverless vs. 傳統(tǒng)容器/虛擬機(jī)
AI 原生架構(gòu)的演進(jìn)主要有兩條路徑,一是通過(guò)虛擬機(jī)/容器運(yùn)行時(shí)逐漸演變?yōu)橐灾悄荏w運(yùn)行時(shí)為代表的 AI 原生架構(gòu);二是直接從 Serverless 運(yùn)行時(shí)進(jìn)化為以智能體運(yùn)行時(shí)為代表的 AI 原生架構(gòu)。
Serverless 架構(gòu)與 AI 時(shí)代需求具有天然契合性,其具備任務(wù)類(lèi)型多樣、流量突發(fā)性強(qiáng)、數(shù)據(jù)安全隔離以及輕量級(jí)、高彈性等優(yōu)勢(shì),使得 Serverless 架構(gòu)在狀態(tài)管理、資源分配和運(yùn)維方面展現(xiàn)出優(yōu)勢(shì),成為 AI 時(shí)代最短的技術(shù)進(jìn)化的路徑。

| 維度 | 傳統(tǒng)架構(gòu)(容器/虛擬機(jī)) | Serverless AI 運(yùn)行時(shí) |
|---|---|---|
| 資源分配 | 靜態(tài)資源分配,彈性不足 | 動(dòng)態(tài)彈性伸縮,按需調(diào)用 |
| 狀態(tài)管理 | 依賴(lài) Redis/DB 等外部組件,跨節(jié)點(diǎn)遷移困難 | 天然支持狀態(tài)持久化與會(huì)話親和性 |
| 調(diào)用模式 | 被動(dòng)響應(yīng)式 API 調(diào)用 | 主動(dòng)規(guī)劃式任務(wù)協(xié)同 |
| 運(yùn)維成本 | 需投入大量人力運(yùn)維 | 免運(yùn)維,零服務(wù)器管理 |
Serverless 架構(gòu)因其動(dòng)態(tài)彈性、免運(yùn)維特性,成為 AI 原生架構(gòu)的最短路徑。開(kāi)發(fā)者可專(zhuān)注于業(yè)務(wù)創(chuàng)新,無(wú)需關(guān)注基礎(chǔ)設(shè)施細(xì)節(jié)。
二、Serverless AI 運(yùn)行時(shí)

作為 AI 時(shí)代的最佳運(yùn)行時(shí),函數(shù)計(jì)算 FC 業(yè)界首推從 Serverless 進(jìn)化為 Serverless AI,推出三大核心運(yùn)行時(shí)底座:
- Serverless 模型運(yùn)行時(shí):
支持超 20,000 + 熱門(mén)開(kāi)源模型一鍵部署為生產(chǎn)級(jí) API。通過(guò)異構(gòu)算力池、請(qǐng)求感知調(diào)度、毫秒級(jí)閑置喚醒、1/N 卡切分技術(shù)實(shí)現(xiàn)實(shí)時(shí)/準(zhǔn)實(shí)時(shí)推理場(chǎng)景冷啟動(dòng)加速,實(shí)現(xiàn) RT 抖動(dòng)減少 80%,最高降本 93.75%。

- 智能體與工具運(yùn)行時(shí)

首創(chuàng) Serverless 級(jí)會(huì)話親和/隔離架構(gòu),通過(guò)毫秒級(jí)啟動(dòng)和上下文保持大幅提升智能體開(kāi)發(fā)、部署和運(yùn)行效率,性能超越傳統(tǒng)方案 100 倍。
率先推出十萬(wàn)函數(shù)、百萬(wàn)實(shí)例級(jí)別的大規(guī)模沙箱服務(wù)(如 Code Interpreter API ),并內(nèi)置 Python/Node.js/Java/PHP/Shell/.NET 等 50 余種多語(yǔ)言環(huán)境,支持 OCI 標(biāo)準(zhǔn)鏡像,原生兼容 MCP 和 Function Call 協(xié)議標(biāo)準(zhǔn)。
這三大運(yùn)行時(shí)均基于函數(shù)計(jì)算構(gòu)建,為開(kāi)發(fā)者提供0 運(yùn)維、極致彈性、成本最優(yōu)的 AI 原生基礎(chǔ)設(shè)施,并聯(lián)動(dòng)阿里云、通義實(shí)驗(yàn)室、魔搭社區(qū)等生態(tài),全面加速 AI 應(yīng)用創(chuàng)新。
Serverless AI 的實(shí)踐驗(yàn)證與生態(tài)聯(lián)動(dòng)

1. 魔搭社區(qū):模型托管的標(biāo)桿案例
- 應(yīng)用場(chǎng)景:支持2萬(wàn)個(gè)熱門(mén)模型一鍵托管,用戶(hù)無(wú)需關(guān)注底層集群配置,30秒內(nèi)生成生產(chǎn)級(jí) API。
- 技術(shù)支撐:依托 Serverless 模型運(yùn)行時(shí),實(shí)現(xiàn)自動(dòng)彈性伸縮與高可用性。
2. Qwen3 Coder 訓(xùn)練:沙箱環(huán)境的高效利用
- 強(qiáng)化學(xué)習(xí):通過(guò)函數(shù)計(jì)算沙箱環(huán)境,Qwen3 Coder 的代碼生成能力顯著提升,無(wú)需維護(hù)訓(xùn)練集群。
- 多語(yǔ)言支持:內(nèi)置運(yùn)行時(shí)環(huán)境適配模型生成代碼的直接運(yùn)行需求,零運(yùn)維、毫秒級(jí)計(jì)費(fèi)。
3. 百煉 MCP 市場(chǎng):工具服務(wù)的原子化部署
- 功能亮點(diǎn):開(kāi)發(fā)者可通過(guò) Serverless 運(yùn)行時(shí)將工具服務(wù)部署為企業(yè)級(jí) MCP,支持冷門(mén)工具低頻調(diào)用與熱門(mén)工具高頻響應(yīng)的靈活適配。
4. 全鏈路 Serverless 生態(tài)聯(lián)動(dòng)
- 產(chǎn)品協(xié)同:整合阿里云日志、網(wǎng)關(guān)等產(chǎn)品,實(shí)現(xiàn)端到端鏈路追蹤、全棧可觀測(cè)性及精細(xì)化成本控制。
- 開(kāi)發(fā)效率:AI 網(wǎng)關(guān)提供多模型協(xié)議適配與語(yǔ)義緩存,模型調(diào)用成功率提升至99.9%。
三、未來(lái)展望:Serverless AI 的無(wú)限可能

- 智能體應(yīng)用的普惠化
- 非技術(shù)開(kāi)發(fā)者可通過(guò) Serverless 平臺(tái)快速構(gòu)建智能體應(yīng)用,降低 AI 開(kāi)發(fā)門(mén)檻。
- 全棧彈性與原子化能力
- 通過(guò) Serverless AI 運(yùn)行時(shí),實(shí)現(xiàn)從模型、智能體到工具的全鏈路彈性資源調(diào)度與原子化服務(wù)編排。
- 生態(tài)開(kāi)放與行業(yè)落地
- 推動(dòng) Serverless AI 技術(shù)標(biāo)準(zhǔn)化,助力企業(yè)實(shí)現(xiàn) AI 原生應(yīng)用規(guī)模化落地,覆蓋智能座艙、工業(yè)自動(dòng)化等場(chǎng)景。
Serverless AI 運(yùn)行時(shí)的誕生,標(biāo)志著云計(jì)算與 AI 技術(shù)的深度耦合。阿里云函數(shù)計(jì)算通過(guò)三大核心技術(shù)(請(qǐng)求感知調(diào)度、毫秒級(jí)喚醒、異構(gòu)算力切分),為 AI 應(yīng)用開(kāi)發(fā)提供了免運(yùn)維、高彈性、低成本的基礎(chǔ)設(shè)施。隨著生態(tài)不斷完善,Serverless AI 將持續(xù)為企業(yè)和個(gè)人創(chuàng)造更多價(jià)值,驅(qū)動(dòng)更多創(chuàng)新應(yīng)用的誕生。

浙公網(wǎng)安備 33010602011771號(hào)