摘要:
nanoVLM 是使用純 PyTorch 訓(xùn)練 你自己的視覺(jué)語(yǔ)言模型 (VLM) 的 最簡(jiǎn)單 方式。它是一個(gè)輕量級(jí) 工具包 ,讓你可以在 免費(fèi)的 Colab Notebook 上啟動(dòng) VLM 訓(xùn)練。 我們受到了 Andrej Karpathy 的 nanoGPT 的啟發(fā),為視覺(jué)領(lǐng)域提供了一個(gè)類(lèi)似的項(xiàng) 閱讀全文
nanoVLM 是使用純 PyTorch 訓(xùn)練 你自己的視覺(jué)語(yǔ)言模型 (VLM) 的 最簡(jiǎn)單 方式。它是一個(gè)輕量級(jí) 工具包 ,讓你可以在 免費(fèi)的 Colab Notebook 上啟動(dòng) VLM 訓(xùn)練。 我們受到了 Andrej Karpathy 的 nanoGPT 的啟發(fā),為視覺(jué)領(lǐng)域提供了一個(gè)類(lèi)似的項(xiàng) 閱讀全文
posted @ 2025-06-18 17:46
HuggingFace
閱讀(361)
評(píng)論(0)
推薦(0)

🧭 TL;DR 今天,我們介紹了 SmolVLA,這是一個(gè)輕量級(jí) (450M 參數(shù)) 的開(kāi)源視覺(jué) - 語(yǔ)言 - 動(dòng)作 (VLA) 模型,專(zhuān)為機(jī)器人領(lǐng)域設(shè)計(jì),并且可以在消費(fèi)級(jí)硬件上運(yùn)行。 僅使用開(kāi)源社區(qū)共享的數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,數(shù)據(jù)集標(biāo)簽為 lerobot。 SmolVLA-450M 的表現(xiàn)優(yōu)于許多更
這是 大模型評(píng)估排障指南 系列文章的第三篇,敬請(qǐng)關(guān)注系列文章: 關(guān)于推理 關(guān)于 \(\LaTeX\) 公式解析 關(guān)于可復(fù)現(xiàn)性 假設(shè)你讀了一篇最近的新模型技術(shù)報(bào)告,然后心血來(lái)潮想要在本機(jī)復(fù)現(xiàn)他們的結(jié)果,卻發(fā)現(xiàn)根本沒(méi)法復(fù)現(xiàn),這是為什么? 讓我們來(lái)探討一下原因。 代碼庫(kù)不同 要想復(fù)現(xiàn)論文或報(bào)告的評(píng)估得分并
這是 大模型評(píng)估排障指南 系列文章的第二篇,敬請(qǐng)關(guān)注系列文章: 關(guān)于推理 關(guān)于 \(\LaTeX\) 公式解析 關(guān)于可復(fù)現(xiàn)性 解析 LaTeX 很難。這個(gè)問(wèn)題在評(píng)估輸出為 \(\LaTeX\) 的模型時(shí)經(jīng)常會(huì)遇到,例如 Hugging Face 的 數(shù)學(xué)評(píng)估基準(zhǔn)。 這個(gè)基準(zhǔn)使用 \(\LaTeX\)
Hugging Face Hub 已成為 AI 協(xié)作的核心平臺(tái),托管了數(shù)萬(wàn)個(gè)模型、數(shù)據(jù)集以及交互式應(yīng)用程序 (Space)。 在開(kāi)放生態(tài)系統(tǒng)中,用戶(hù)知情同意的管理方式與那些更 "數(shù)據(jù)饑渴" 的科技公司的封閉產(chǎn)品截然不同。本文將通過(guò)分析 Hugging Face Hub 平臺(tái),探討由官方主導(dǎo)項(xiàng)目與社區(qū)
這是 大模型評(píng)估排障指南 系列文章的第一篇,敬請(qǐng)關(guān)注系列文章: 關(guān)于推理 關(guān)于 \(\LaTeX\) 公式解析 關(guān)于可復(fù)現(xiàn)性 模型運(yùn)行非常慢怎么辦? 調(diào)整 batch size 如果你想要評(píng)估結(jié)果完全可復(fù)現(xiàn) (在特定的輸入 prompt 和硬件條件下),你可以把 batch size 可以設(shè)為 1。
這是 讓 LLM 來(lái)評(píng)判 系列文章的第六篇,敬請(qǐng)關(guān)注系列文章: 基礎(chǔ)概念 選擇 LLM 評(píng)估模型 設(shè)計(jì)你自己的評(píng)估 prompt 評(píng)估你的評(píng)估結(jié)果 獎(jiǎng)勵(lì)模型相關(guān)內(nèi)容 技巧與提示 LLM 評(píng)估模型已知偏差及緩解措施: 缺乏內(nèi)部一致性:同一 prompt 輸入評(píng)估模型執(zhí)行多次得到的結(jié)果可能不一樣 (如果
Open R1 項(xiàng)目進(jìn)展第三期 本次更新帶來(lái)三大突破性進(jìn)展: CodeForces-CoTs 數(shù)據(jù)集: 通過(guò) R1 模型蒸餾生成近 10 萬(wàn)條高質(zhì)量編程思維鏈樣本,同時(shí)包含 C++ 和 Python 雙語(yǔ)言解題方案 IOI 基準(zhǔn)測(cè)試: 基于 2024 國(guó)際信息學(xué)奧林匹克競(jìng)賽 (IOI) 構(gòu)建的全新挑
浙公網(wǎng)安備 33010602011771號(hào)