如何給本地部署的DeepSeek投喂數(shù)據(jù),讓他更懂你
http://www.rzrgm.cn/xiezhr/p/18714692
寫在前面
在上一篇文章中,我們說了怎么在本地部署DeepSeek。對本地部署DeepSeek感興趣的小伙伴看過來。
本地部署 DeepSeek:小白也能輕松搞定!
話說回來了,為啥要本地部署呢?
① 在使用DeepSeek中,經(jīng)常會出現(xiàn)服務器繁忙,請稍后再試。
② 不想讓個人隱私數(shù)據(jù)暴露出去
③ 可以將各種格式的文件,如pdf、csv、txt、md 格式的數(shù)據(jù)投喂給它。比如你想讓 DeepSeek 了解你的公司業(yè)務,就把相關的文檔上傳給它。
DeepSeek 就能吃下你給它的各種“知識大餐”,然后變得更聰明,更懂你
一、RAG是什么?
為了投喂數(shù)據(jù),我們要用到RAG。首先,我們先來了解下什么是RAG?
我們就問問昨天部署好的DeepSeek好了。
首先我們在命令行輸入:ollama run deepseek-r1:1.5b 命令,啟動DeepSeek

然后打開瀏覽器并輸入快捷鍵:ctrl+shift+l 調出WebUI可視化AI界面

輸入:RAG是什么?

翻譯成大白話就是:我們把知識放到知識庫里,然后把它投喂給人工智能。我們需要用一個量化的工具,把各種格式的數(shù)據(jù)量化給人工智能,讓它能看得懂。
人工智能通過對這些知識的學習后,以后你再問它的時候,他就能將知識提取出來,加工處理后回答你的問題。
RAG 就是讓 DeepSeek 不僅能靠自己的知識庫回答問題,還能通過檢索外部數(shù)據(jù)來增強回答的準確性和豐富性。就好比你考試時偷偷帶了小抄,但 DeepSeek 是光明正大地“作弊”,還能把答案說得頭頭是道。
二、 拉取nomic-embed-text
剛說了RAG是啥?我們需要一個RAG工具來完成量化工作。
各種開源免費的RAG工具挺多,我們這里選擇最近比較獲得ollama 提供的nomic-embed-text。
https://ollama.com/library/nomic-embed-text

我們使用上面圈出來的命令拉取即可,274M,大約1min左右就可以下完,出現(xiàn)【success】字樣表示下載成功。

三、RAG設置
打開WebUI界面,我們會看到一個RAG設置文本嵌入模型。
文本嵌入模型就是把我們投喂的各種文檔數(shù)據(jù)量化成DeepSeek認識的數(shù)據(jù)。

四、添加新知識
工具都準備好后,我們開始準備給DeepSeek投喂數(shù)據(jù)......
① 投喂前不認識曉凡
在投喂數(shù)據(jù)之前,我們問問它認不認識曉凡。結果不用我說了,肯定是不知道的 ??

② 準備投喂的數(shù)據(jù)
接下來,將曉凡事先準備好的關于曉凡的簡介【程序員曉凡.md】文檔投喂給它,文檔內容如下。

③ 投喂數(shù)據(jù)



④ 投喂完成后,已經(jīng)認識曉凡了

五、其他數(shù)據(jù)投喂測試
我們準備一個【學生選課系統(tǒng)接口文檔 V1.1.md】接口文檔

按照上面方法進行投喂

接下來,我們我們讓DeepSeek 用Java語言實現(xiàn)【獲取學生選課信息】這一接口功能

本期內容到這兒就結束了,希望對您有所幫助。
我們下期再見 ヾ(?ω?`)o (●'?'●)
本文來自博客園,作者:程序員曉凡,轉載請注明原文鏈接:http://www.rzrgm.cn/xiezhr/p/18714692

浙公網(wǎng)安備 33010602011771號