摘要:
前言 最近在做標(biāo)書的時(shí)候發(fā)現(xiàn),有些文檔文字量很大,想讓大模型完全解讀不太現(xiàn)實(shí),先不說 context 長度夠不夠,首先 token 消耗量就爆炸了 于是想到使用取巧的方式,提取 PDF 的目錄來進(jìn)行分析,于是說干就干,用 C# 寫了一個(gè)工具來實(shí)現(xiàn)目錄提取,結(jié)果效果還不錯(cuò) 后續(xù)我又繼續(xù)完善這個(gè)工具,增 閱讀全文
前言 最近在做標(biāo)書的時(shí)候發(fā)現(xiàn),有些文檔文字量很大,想讓大模型完全解讀不太現(xiàn)實(shí),先不說 context 長度夠不夠,首先 token 消耗量就爆炸了 于是想到使用取巧的方式,提取 PDF 的目錄來進(jìn)行分析,于是說干就干,用 C# 寫了一個(gè)工具來實(shí)現(xiàn)目錄提取,結(jié)果效果還不錯(cuò) 后續(xù)我又繼續(xù)完善這個(gè)工具,增 閱讀全文
posted @ 2025-08-20 11:05
程序設(shè)計(jì)實(shí)驗(yàn)室
閱讀(943)
評論(9)
推薦(11)

浙公網(wǎng)安備 33010602011771號