2024年度Graph+AI開源探索思考

前記
這篇年度總結其實醞釀了許久,卻因諸多原因拖至臘月底,此時趕在春節前發出來,也不失為“農歷版”年度總結了。所謂年度總結,一般是“溫故而知新”,我不太想落入堆疊數字指標的“秀肌肉式”窠臼,而是想分享一下2024年我們(螞蟻圖計算團隊)在「Graph+AI」開源技術方向的實踐過程和思考,和大家聊一聊這個技術方向帶給了我們什么,面向2025年還有哪些有意思的事情可以繼續探索。
屋外寒風瑟瑟,時而夾雜著幾滴冬雨拍打至窗前,伴著書桌上咖啡的徐徐熱氣,我們開啟年初的回憶……
1. 時代變革
2022年底ChatGPT發布,開啟了大模型時代的技術熱。首當其沖的自然是模型訓練,諸多廠商紛紛加入「技術信仰派」的行列,直到后來眾所周知的「百模大戰」。另一方面是基于大模型的智能化應用建設,造就了更廣大的「市場信仰派」群體,「提示工程」、「模型微調」、「RAG」、「智能體」等技術熱點名詞更是層出不窮。
在市場信仰派中,應用軟件屬于較早探索大模型應用場景的領域,因為這種結合最簡單、最直接,并且有效。利用大模型的自然語言理解優勢,改善產品的交互UI、自動化業務流程、構建答疑助手等等。早期使用者借助微調模型將自然語言翻譯為產品自身的API調用或者DSL,當上下文不足時,再引入「向量數據庫」增強生成效果等等。然后向量數據庫趁著大模型的風“狠狠”地火了一把……
同時我們也看到很多基礎軟件,在大模型剛剛興起時并未選擇“盲目”跟進。個人認為,一方面基礎軟件的產品生態更下沉一些,穩定性需求強于易用性,不像應用軟件亟需通過大模型技術自我變革改善用戶體驗。另一方面基礎軟件開發者更堅信長期主義,傾向于深耕專業技術逐步升級產品能力。「曲則全,枉則直」,這種堅持在過往產品迭代中發揮了巨大能量,但現在回頭再看,在大模型時代下,可能需要做出適度的改變。
2. 圖計算開源
作為基礎軟件中的一員,圖計算產品在這方面其實也是“后知后覺”的,雖然在2023年中我們曾做過一些思考嘗試,但未形成明確的戰略共識。直到2023年底,因為開源,我們做出了一些不一樣的改變。這里既有主動的一面,也有被動的一面。主動方面是開源非常適合作為「技術試驗田」,應用場景可以用更低的成本驗證,同時我們相信這次大模型帶來的技術變革非同以往。被動方面是大模型技術太熱了,但開發者的注意力是有限的,單純從社區活躍度的需求出發,也應該選擇加入。所謂「反者道之動」,我們不能只看到大模型技術對圖計算技術熱度的沖擊,而應該借助大模型技術的力量,讓圖計算技術的真正價值發揮出來。
想明白了僅僅是第一步,關鍵是怎么做呢?一般遇到這種事,最簡單的辦法是參考同類產品「依葫蘆畫瓢」,但是這個方法有個風險,就是可能別人也做錯了,我們會跟著錯。實際更悲催的是,我們并沒有可以畫瓢的葫蘆,因為大模型技術太新了,更沒有多少人在Graph+AI這個方向上給出明確的思路。在這種情況下,我們借鑒開源社區的建設思路 —— 尋找我們的「生態上下游」結合點。

這張「十字路口圖」是借助Claude繪制的一個簡單的圖計算技術生態上下游關系。從縱向關系看,圖分析與圖可視化與用戶距離更近,也更容易借助AI技術提升用圖的效率與體驗。從橫向關系看,圖計算技術本身就有數據庫(圖數據庫)與大數據(圖計算引擎)雙重屬性,參考「Data+AI」的技術結合思路也不失為一種高效的選擇。當然,也不能忽略Graph自身與AI技術直接結合的思路,這個很有意思,最能體現圖自身的特色,后邊我會展開來講。
3. Graph + AI
在2024年探索Graph+AI技術的過程中,我們還聯合之江實驗室以及各大高校和企業撰寫并發布了《Graph+AI:大模型浪潮下的圖計算》白皮書,從數據、算法、應用三個方面全方位論述「Graph+AI」技術結合點。涵蓋了圖數據構建、圖神經網絡、圖基礎模型、知識圖譜、GraphRAG等熱門技術,深度解讀了AI時代的圖計算技術應用場景和產業價值。接下來,我會結合圖計算的生態上下游,重點闡述應用層面圖計算的開源探索與思考。

3.1 Converged Index
融合索引是提升大模型「用數能力」的關鍵技術,自2024年中Rockset被OpenAI收購后,融合索引技術開始逐步深入到數據庫和數倉系統中,甚至形成了“在數據倉庫上面擴展向量檢索和語義檢索并不困難,但是反之不行”這樣的結論。Rockset的存在打通了「大數據」與「大模型」之間的“橋梁”,后續我們也看到了大量的主流數據庫和數據倉庫開始提供了向量索引的支持。當然TuGraph也不例外,我們在原來圖、表索引的基礎上,擴展了全文、向量索引的能力,并在未來隨著多模態技術的發展,逐步支持圖片、音頻、視頻等多模態索引能力,持續增強圖數據分析能力。

3.2 OSGraph
圖可視化技術可以說是圖計算領域最經典的應用技術了,由于圖數據結構的天然復雜性,借助圖可視化組件(如AntV G6)可以大幅降低圖數據的理解成本。再漂亮的可視化工具,本質目的還是為了「數據洞察」服務的。從2024年初,我們嘗試基于GitHub的真實數據,構建「開源圖譜洞察」工具OSGraph,用于分析開源社區的項目和開發者的活動和關系。
示例中,我們通過OSGraph項目自身的「項目貢獻圖譜」開始,找到項目的關鍵開發者KingSkyLi、zhongyunWan等,并能發現X-lab實驗室的will-ww、frank-zsy、xiaoya-yaya等。同時也可以關聯到graph、database等技術領域,以及TuGraph社區等。

當前OSGraph已正式發布2.0版本,完成了從「圖可視化」到「圖數據洞察」的升級,下一步我們的目標是「圖智能洞察」。借助于大模型能力,構建開源圖譜上的數據增強、智能分析能力,實現更靈活和自由的開源數據探索。
3.3 Text2GQL
關于Text2SQL技術,相信很多人已經耳熟能詳,也是數據庫結合大模型技術的最早場景,為數據庫上的自然語言交互形態提供了基礎能力。而在圖數據庫領域,存在一個非常基礎的挑戰:圖查詢語言缺少廣泛普及的統一標準。ISO/GQL標準也是2024年4月份剛剛發布的,這導致了Text2GQL語料的極度匱乏,因此構建圖數據庫上的自然語言查詢能力的首要工作是進行Text2GQL的語料合成。

我們從2023年底就開始了Text2GQL的建設工作,構建了「語法制導的語料生成」方案,為圖查詢語言微調提供了必要的語料合成基建,最終通過OSPP項目聯合社區開發者完善了此方案,并將源碼開放到Awesome-Text2GQL項目。同時,Text2GQL的合成語料和微調模型也開放到DB-GPT-Hub項目中,預測準確率達到92%以上。

借助Text2GQL微調模型能力,增了強圖查詢的自然語言理解能力,這為GraphRAG的查詢理解鏈路建設提供了重要的基礎。
3.4 GraphRAG
2024年4月底,微軟發表了GraphRAG論文,引爆了GraphRAG技術熱。我們也在5月中聯合DB-GPT社區共同發布了業內第二個GraphRAG框架,并對其做了持續改進。
- 2024年05月:發布DB-GPT GraphRAG框架,兼容向量、圖、全文索引。
- 2024年08月:圖團隊發布行業首篇GraphRAG綜述。
- 2024年09月:支持社區摘要和混合檢索,索引成本降低50%。
- 2024年12月:支持文檔結構圖譜,索引成本降至40%,性能提升20%。
- 2025年01月:支持向量驅動檢索以及文本驅動檢索,集成Text2GQL能力。
隨著GraphRAG鏈路的持續改進,我們逐漸體會到Jerry Liu在LlamaIndex技術報告中提出的:「RAG的盡頭是Agent」這個觀點了。因此對于GraphRAG,下一階段演進方向將會是GraphAgent,即「圖智能體」。同時GraphRAG將作為智能體關鍵技術組件,以「知識庫」或「記憶系統」的形式而繼續存在。

3.5 Chat2Graph
還記得2024年初我寫了一篇關于LangChain的工程化解讀文章,描繪了LangChain是如何從LLM開始逐步構建自身Agent的技術路徑的。經過這兩年大模型應用技術的發展,我們對這個過程的認知也越來越清晰:「既然大模型的幻覺不可避免,那么引入諸多改進技術的最終結果一定是智能體」。

關于大模型應用技術,業內有句不成文的說法:「23年卷SFT,24年卷RAG,25年卷智能體」。這與我們這兩年在「Graph+AI」的實踐技術路線也是相當吻合,2025年,我們也即將開源圖數據庫的多智能體系統Chat2Graph「An Agentic System on Graph Database」,借助智能體實現真正的「與圖對話」。

3.6 Graph Native
綜上所述,不管是在圖分析、圖可視化方向的縱向探索,還是模型微調、RAG、智能體等方向的橫向探索,借助開源社區「生態上下游」的理念,我們在2024年取得了諸多技術建設成果。但這也為我們自身設置了新的枷鎖:不知不覺中我們成了技術的“搬運工”,一直在用「遷移學習」的方式將相關技術“復刻”到圖計算領域。比如,融合索引復刻了Rockset、OSGraph復刻了OSSInsight,Text2GQL復刻Text2SQL、GraphRAG復刻VectorRAG。
因此,我們需要從「圖原生」的角度出發,思考圖真正的價值是什么,從「借鑒生態」到「賦能生態」,這是我理解的「回到社區」。Chat2Graph雖然也參考了部分常見的Agent的技術,但在這個系統中,我們更想體現的是Graph在Agent生態中獨有的價值,我們想把這塊獨特性一并做到Chat2Graph中。
回顧過往近十年的螞蟻圖技術建設和應用實踐,我認為最有價值的地方不僅體現在業務規模和經濟效益上,還有對圖的理解與認知。如果一定把這種認知壓縮成一個關鍵詞,我認為應該是「連接」。連接可以直觀地描述確定性和必然性,連接也可以表現為穩定性和可解釋性。插入個彩蛋,圖中有句話我特別喜歡:「存在不是實體的集合,而是關系的場域」,這句話是「李繼剛」使用提示詞引導Claude生成的,我深為共鳴。

近來我經常引用人工智能的三大流派「符號主義」、「連接主義」、「行為主義」的內容,因為我覺得用這個去描述「Graph+AI」的思想來源特別的合適。

這里最想展開的是「符號主義」與「連接主義」的交叉結合部分,其中最典型的代表技術是GraphRAG和KAG。前者傾向于基于知識圖譜檢索增強大模型生成上下文,后者側重于知識圖譜的直接推理。雖然前邊一直在描述圖的「連接」本質 —— 確定性與可解釋性,好像只是「符號主義」的范疇,但事實上圖技術已經深度融入到AI技術棧中,其實只看技術名詞便能體會得到:「連接主義」、「神經網絡」。因此圖技術的應用前景,遠不止「符號主義」與「連接主義」結合的單一路徑。
這里我結合從LLM到Agent的演進路徑,探討一下圖技術的結合點:
- LLM:仿生大腦,神經元連接規?;笥楷F智能,神經網絡是最直觀的計算圖。
- 推理:仿生思考,解決復雜問題,思維鏈(COT)、樹形思考(TOT)、圖形思考(GOT)。
- 記憶:仿生海馬體,感知記憶、短期記憶、長期記憶的分層記憶管理,維護記憶信息的連接。
- 工具庫:仿生四肢,復雜的工具調用自動形成順序和依賴圖。
- 知識庫:仿生圖書館,提供更準確的知識關聯,典型代表知識圖譜。
- 智能體:仿生個人,匯集大腦、思考、記憶、工具庫、知識庫構成完整個體,并具備外部感知交互能力。
- 多智能體:仿生社會,構建復雜任務規劃圖,多智能體協作構成通信圖。
我們用更廣義的仿生去理解大模型與智能體,會發現圖技術幾乎無處不在,究其原因只能歸結為「事物的普遍聯系性」了,或許到這里我們才開始摸到圖計算在AI時代的一些「脈搏」,未來我們會在Chat2Graph這個項目中做持續的落地與驗證。
4. TuGraph開源
回顧2024年,不知不覺中我們在探索「Graph+AI」技術演進過程中,逐步形成了如下的開源技術產品矩陣。從Graph Infra層已經/即將開源的圖計算基礎能力,結合上層的Text2GQL、GraphRAG的AI Infra層建設,逐步打造并完善圖數據庫多智能體系統Chat2Graph,并將其賦能到OSGraph和更多的應用層場景中去。

作為布道師,需要同時touch到技術、內容和社區三個維度。關于開源,我們一直奉行的準則是:「技術是核心,通過技術迭代產出優質內容,既而影響社區」。對社區來說:「通過優質內容發現有用的技術,既而賦能自身的應用場景」。這是個雙向反饋的過程,我們會持續在保持「開發者關系」(DelRel)、「公共關系」(PR)和表達關系三個維度上持續深耕。比較可喜的是,經過2024年「Graph+AI」路徑上的持續探索,TuGraph在開源社區綜合指標(OpenRank)上,逐步領先于同類產品,這進一步堅定了我們對這個技術方向的投入和信心。

也正式歸功于在「生態上下游」這個大方向的探索與實踐,TuGraph有幸拉動了DB-GPT、AntV、X-lab、OpenSPG、OceanBase、VSAG、Libro等社區的聯合共建,并獲得到2024年度OpenStar最佳SIG組獎項。在此,對螞蟻開源委員會、螞蟻開源辦公室的認可,表示特別的感謝。

后記
其實想聊的還有很多,局限于篇幅,我只能把最想和大家分享的感受列舉如上。實際上「Graph+AI」的開源技術領域遠不止如此,受制于我個人的工程知識背景,并未對大模型訓練過程與圖技術的結合做更多展開。最后,還有幾個特別的點想稍微提及一下,因為我覺得2024年少了這些會有點不太完整。
首當其沖的,是「提示工程」(Prompt Engineering)。相信不少人對這個技術領域多少有一些偏見,甚至不乏有人覺得這壓根不是什么技術領域,更有人將提示工程師比作「巫師」,提示詞是他們發出的「咒語」。在這里我想表達的是,提示工程雖然看起來不像寫代碼那么「科學」,但并不代表它不具備「邏輯」,大模型時代我們可能需要更「哲學」的思維,這點在優秀的提示工程師身上幾乎是必備的素養。關于這些,大家可以參考我訪談「李繼剛」的交流稿,看完可能會有不一樣的感受。
另外,隨著大模型能力的持續增強,提示詞的重要性將會越來越高。如果你正在開發智能體,試想一下你在針對應用場景不斷優化智能體的過程中,有多少時間是在修改提示詞?或許會有人質疑說,那這樣我們還做智能體做什么,直接攻堅提示工程不就完了,甚至不少提示工程師也是這么認為的。但這里,我就拋出一個問題,暫時不給出我的答案,大家可以帶回去細想,可能會有別樣的收獲。

最后,不得不提及剛發布的DeepSeek-R1了,結合著前陣子吃瓜的gpt-4o-mini可能是8B模型,大家有沒有發現我們所熟知的大模型正在朝著小模型、低成本的方向加速迭代。這也就意味著,那些過去只有在帶GPU的服務器上才能運行的模型,將來必然會出現在每個人的手持設備上,而且推理質量和性能甚至比當下最好的大模型都要好。那么,人手一個「最懂你的AI助理智能體」將不再是問題,TA可能比你自己還要了解你,幫你購物、訂餐、開會、寫作,相當于24小時的私人秘書。再結合多智能體系統協作的思路,當你的微信群、釘釘群里,大部分時間是智能體之間在溝通,而你只需要和智能體保持必要的信息對齊即可,這將會給個人和社會帶來多大的改變?不敢細想?。。?/p>
言至于此,不覺已是深夜,就此打住!
祝大家新春快樂,蛇年大吉?。?!
參考
- Graph+AI白皮書:https://mp.weixin.qq.com/s/fxwMJ83NFNt2hmNBuUgzog
- 融合索引:https://rockset.com/blog/converged-indexing-the-secret-sauce-behind-rocksets-fast-queries
- 潑天富貴,OpenAI收購數據倉庫公司,為什么?:https://mp.weixin.qq.com/s/ZKLFOQjjftHGWXDfgaq4Pw
- TuGraph融合索引:https://github.com/TuGraph-family/tugraph-db/blob/v5.x/docs/development_guide.md
- AntV G6:https://github.com/antvis/G6
- OSGraph:https://osgraph.com
- OSGraph項目:https://github.com/TuGraph-family/OSGraph
- X-lab社區:https://github.com/X-lab2017
- TuGraph社區:https://github.com/TuGraph-family
- OSGraph 2.0:https://github.com/TuGraph-family/OSGraph/releases/tag/v2.0.0
- ISO/GQL:https://www.gqlstandards.org
- 語法制導的語料生成:https://mp.weixin.qq.com/s/rZdj8TEoHZg_f4C-V4lq2A
- Text2GQL開源之夏項目:https://mp.weixin.qq.com/s/PCV4Qi9w9K-tRf1vMWHpEQ
- Awesome-Text2GQL:https://github.com/TuGraph-family/Awesome-Text2GQL
- 微軟GraphRAG論文:https://arxiv.org/abs/2404.16130
- DB-GPT項目:https://github.com/eosphoros-ai/DB-GPT
- DB-GPT GraphRAG:https://mp.weixin.qq.com/s/WILvYFiKugroy9Q_FmGriA
- GraphRAG綜述:https://mp.weixin.qq.com/s/Dx8pYhmbrhtRMXNez_GOmw
- 社區摘要增強:https://mp.weixin.qq.com/s/LfhAY91JejRm_A6sY6akNA
- 文檔結構圖譜:https://mp.weixin.qq.com/s/EQ3QnWWt1v9_S79MdRaJlw
- 向量驅動檢索:https://github.com/eosphoros-ai/DB-GPT/pull/2200
- 文本驅動檢索:https://github.com/eosphoros-ai/DB-GPT/pull/2227
- LlamaIndex技術報告:https://mp.weixin.qq.com/s/wuyMN7CLAT9HGYlmjLWUtA
- LangChain的工程化解讀:https://mp.weixin.qq.com/s/9HtxRuyzavovC9NytzCDIg
- KAG項目:https://github.com/OpenSPG/KAG
- OpenSPG社區:https://github.com/OpenSPG
- OceanBase社區:https://github.com/OceanBase
- VSAG社區:https://github.com/antgroup/vsag
- Libro社區:https://github.com/difizen/libro
- 李繼剛訪談:https://zhuanlan.zhihu.com/p/7494277954
- DeepSeek-R1:https://github.com/deepseek-ai/DeepSeek-R1
- gpt-4o-mini可能是8B:https://mp.weixin.qq.com/s/bT_w-T9ElmPUXbYA1f7kCg
若本文對你有所幫助,您的 關注 和 推薦 是我分享知識的動力!
浙公網安備 33010602011771號