摘要:
0 概述 **VLM可以做的任務(wù)類型** 視覺定位/物體檢測(cè)(Visual grounding) 圖像和視頻總結(jié)(image caption) 視覺問答(visual question answering) 圖像-文本對(duì)比學(xué)習(xí) 生成式任務(wù) 對(duì)齊式任務(wù)文本解析和手寫文檔 圖像分類 語義分割 圖像文本檢 閱讀全文
posted @ 2025-10-12 18:57
不負(fù)如來不負(fù)卿x
閱讀(19)
評(píng)論(0)
推薦(0)

浙公網(wǎng)安備 33010602011771號(hào)