Dify 工作流實踐--PDF工商信息識別(進階版本,接入本地知識庫識別代碼)
接前面一篇文章,完成PDF中圖片中文字的識別
今天的場景中,我們會根據自己定義的標準(可能是國標,或者歐標等,因為各個地區表準不一樣),進行分類識別,這里引入本地知識庫查詢
自己定義出分類標準
看看流程:

增加了知識庫:
注意:當我們想要用關鍵字檢索時(文本匹配),請將knowlage retrive配置改為:

增大關鍵字匹配的權重,經測試效果非常好(類似于文本匹配)
關于knowlage base的配置:

選擇embedding和rerank模型:

文本知識庫格式Excel:

執行效果:

分享DSL


浙公網安備 33010602011771號