RAGnarok 功能與技術規格說明書
?? 思考可以構成一座橋,讓我們通向新知識。—— 普朗克
1 寫作目標(Functional Specification, FS)
2 概念與術語
| 術語 |
別名 / 縮寫 |
定義 |
說明 |
| RAG |
檢索增強生成 |
將信息檢索與大語言模型生成結合,提高回答準確性 |
具備可追溯知識依據 |
| LLM |
大語言模型 |
大規模語料預訓練模型 |
例:GPT?4、Claude |
| MCP |
模型上下文協議 |
統一描述模型 I/O 的數據協議 |
本項目模塊通信中間語 |
| Pipeline |
流水線架構 |
多模塊問答流程,可自由編排 |
檢索→重排→生成 |
| 知識庫 |
KB |
嵌入后存儲文檔語義的數據庫 |
公有/私有,權限隔離 |
| 向量化 |
嵌入 |
文本→向量,便于匹配檢索 |
—— |
| 模塊 |
組件 |
可插拔功能單元 |
通過 MCP 連接 |
| 多租戶 |
Multi?Tenant |
不同企業/用戶數據隔離 |
—— |
| 智能 Agent |
Agent |
多步推理與調用鏈的智能體 |
—— |
| 開箱即用 |
OOTB |
無需編程即可使用 |
面向 C 端 |
3 產品描述
3.1 項目簡述
RAGnarok 是一站式智能問答平臺,提供模塊化 Pipeline 架構與 MCP 協議,幫助開發者、企業與普通用戶低成本構建 RAG 應用。
3.2 用戶畫像
| 角色 |
身份特征 |
潛在總量 |
使用習慣 |
期望 |
付出 |
| 開發者 |
IT 從業者 |
10 萬 |
構建項目、調試監控 |
模塊拼裝 + 調試 |
付費一般 / 貢獻強 |
| B 端企業 |
IT 企業 |
100 |
公共庫上構建工作流 |
私有部署 + 高效管理 |
付費強 |
| C 端用戶 |
個人 |
50 萬 |
個人知識庫問答 |
簡潔體驗 + 準確回答 |
付費弱 |
3.3 典型場景
- 開發者:二次開發、插件集成、實時監控。
- 企業運營:跨系統集成、數據安全、私有化部署。
- 日常問答:信息查詢、知識檢索、智能問答。
4 產品功能(Alpha + Beta)
4.1 Alpha 已交付
- 知識庫管理:多源文檔導入、向量化、權限隔離。
- 核心 RAG 流程:檢索 → 重排 → 生成,支持 SSE 流式輸出。
- 工作流編排 (API):JSON 定義 Pipeline,后端執行。
4.2 Beta 新增
| 新功能 |
說明 |
價值 |
| 可視化 Flow Builder |
拖拽節點、連線、實時預覽 |
C 端零代碼使用,降低門檻 |
| Admin Portal |
租戶 / 用戶 / 資源 / 角色管理 |
企業級安全與運維 |
| 插件市場 |
官方 / 社區組件上架、評分、安裝 |
擴展生態、差異化競爭 |
| 觀測中心 |
Prometheus + Grafana + Sentry |
性能可視化、故障告警 |
| 反饋埋點 |
匿名事件上報、Funnel 分析 |
快速迭代,根據數據決策 |
5 顯性與隱性依賴
- 知識庫質量直接決定 RAG 答復質量。
- Pipeline 執行依賴 MCP 協議的統一結構。
6 潛在問題與解決方案
| 問題 |
描述 |
對策 |
| 性能瓶頸 |
大量數據 / 高并發 |
緩存 + 負載均衡 + 分布式 |
| 數據安全 |
私有庫防越權 |
RBAC + 加密存儲 |
| 瀏覽器兼容 |
老舊環境 |
兼容提示 + 降級模式 |
| 插件安全 |
擴展腳本風險 |
沙盒執行 + 簽名校驗 |
7 系統能力邊界
- 并發用戶:基于水平擴展,可支撐萬級 QPS;單實例上限取決于硬件。
- 高峰負載:動態資源調度,自動擴容。
- 單請求數據量:推薦 ≤ 2?MB,超限時分頁處理。
- 瀏覽器支持:Chrome / Edge / Firefox / Safari 最新正式版。
8 產品目標(學期 OKR)
| 指標 |
目標 |
| 真實用戶 |
≥ 200 |
| DAU |
≥ 30 |
| 上傳文檔 |
≥ 300 份 |
| 構建任務 |
≥ 100 次 |
| 模型調用 |
≥ 500 次 |
| GitHub Star |
≥ 500 |
| Docker Pull |
≥ 300 |
9 技術棧與架構
- 后端:FastAPI + SQLAlchemy + PostgreSQL + Qdrant + MinIO (+ Redis 可選)
- 前端:React + React?Flow + Zustand
- DevOps:Docker / Helm / GitHub Actions → K8s
- Observability:Prometheus, Grafana, OpenTelemetry, Sentry
(Front: React?Flow) ─? server(API) ─? core(engine) ─? toolkit(drivers)
▲ │ │
└─ WebSocket(SSE) ?──┘ observability
10 Beta 路線圖
| Sprint |
時段 |
重點 |
| β?0 |
05?20 ~ 05?25 |
架構改造:Redis Streams / Observability 基礎 |
| β?1 |
05?26 ~ 06?01 |
Flow Builder MVP(拖拽 + 草稿保存),插件市場 API + 前端 |
| β?2 |
06?02 ~ 06?08 |
Admin Portal & 權限 V2,全鏈路監控 & 告警 |
任務追蹤:全部通過 飛書文檔
11 驗收標準(Beta)
- 功能可用:新增功能在演示環境完整跑通。
- 性能達標:常規調用 ≤?1?s;異常鏈路自動回退。
- 安全通過:無越權訪問,插件運行受沙盒限制。
- 測試通過:CI 自動化測試全綠,覆蓋率 ≥?80?%。
- 文檔同步:用戶手冊、API 文檔與代碼一致。
12 風險與應對
| 風險 |
等級 |
緩解措施 |
| 插件安全 |
高 |
沙盒執行 + 代碼簽名 + 審核流程 |
| 權限回歸 |
高 |
越權用例 > 100 + 代碼審計 |
| UI 復雜度 |
中 |
原型評審 + 雙周迭代 |
| 工期延誤 |
中 |
關鍵路徑每日站會,風險提前暴露 |