摘要:
中文分詞是NLP中一個(gè)獨(dú)特且富有挑戰(zhàn)性的任務(wù),因?yàn)橹形奈谋緵]有像英文空格那樣的天然詞語邊界。 現(xiàn)代分詞器模型(尤其是基于Transformer的模型如BERT、GPT等使用的中文分詞器)主要采用子詞分詞算法,但其處理方式與英文有顯著不同。 特性傳統(tǒng)中文分詞器 (如Jieba, HanLP)現(xiàn)代模型分 閱讀全文
posted @ 2025-10-22 17:55
wangssd
閱讀(16)
評論(0)
推薦(0)
摘要:
Hugging Face Hugging Face 是一個(gè)開源的機(jī)器學(xué)習(xí)平臺(tái)和社區(qū)。 庫名稱主要功能官方資源/文檔鏈接 Transformers 🤗 提供數(shù)千個(gè)預(yù)訓(xùn)練模型,用于自然語言處理(NLP)、語音識別、計(jì)算機(jī)視覺等任務(wù)。 https://huggingface.co/docs/transf 閱讀全文
posted @ 2025-10-22 14:43
wangssd
閱讀(8)
評論(0)
推薦(0)
摘要:
預(yù)訓(xùn)練(基礎(chǔ)知識廣泛學(xué)) 微調(diào)(具體實(shí)操崗前學(xué)) 后訓(xùn)練(RLHF專業(yè)領(lǐng)域深入學(xué)) 策略模型、參考模型、價(jià)值模型、獎(jiǎng)勵(lì)模型 策略模型:待后訓(xùn)練的大模型 參考模型:初始的策略模型。 獎(jiǎng)勵(lì)模型(RM):目標(biāo)是刻畫模型的輸出是否在人類看來表現(xiàn)不錯(cuò)。即,輸入 [提示(prompt),模型生成的文本] ,輸出 閱讀全文
posted @ 2025-10-22 09:33
wangssd
閱讀(10)
評論(0)
推薦(0)

浙公網(wǎng)安備 33010602011771號