摘要:
這一篇博文想寫很久了,一直沒有下筆,核心原因也是有一些待辦的思路在攻關(guān)驗證。 我們先從一個核心的問題出發(fā), 1. 為什么要研究優(yōu)化器算法? 它的關(guān)聯(lián)問題:訓(xùn)練為什么要調(diào)參,調(diào)的是什么參? 如果就這個問題去問各種大語言模型,它們能給出一堆的理由。 但就博主而言,答案只有一個: 干掉調(diào)參,解放生產(chǎn)力,榨 閱讀全文
posted @ 2025-10-06 10:29
cpuimage
閱讀(1105)
評論(0)
推薦(3)

浙公網(wǎng)安備 33010602011771號