one-shot learning簡介
這是遷移學習的兩種極端形式
zero-shot learning
指的是我們之前沒有這個類別的訓練樣本,但是我們可以學習到一個映射X->Y, 如果這個映射足夠好的話, 我們就可以處理沒有看到的類了. 比如, 我們在訓練時沒有看見過獅子的圖像, 但是我們可以用這個映射得到獅子的特征. 一個好的獅子特征, 可能就和貓, 老虎等等比較接近, 和汽車, 飛機比較遠離. 感性認識的話, 雖然我們不知道這東西叫獅子, 但是我們可以說出他和誰誰誰像..
One-shot learning
指的是我們在訓練樣本很少, 甚至只有一個的情況下, 依舊能做預測. 如何做到呢? 可以在一個大數據集上學到general knowledge(具體的說, 也可以是X->Y的映射), 然后再到小數據上有技巧的update.
我們可以認為零數據學習場景包含三個隨機變量: 傳統輸入 x, 傳統輸出或目標 y, 以及描述任務的附加隨機變量 T. 該模型被訓練來估計條件分布 p(y|x;T), 其中 T 是我們希望執行的任務的描述.
下面的試驗主要是針對字符識別來做的
總體方法
verification_task --> one-shot_classification
1. 學習圖像的表示
learn image representations via a supervised metric-based approach with siamese neural networks
verification task
學習一個神經網絡, 由于判斷一個圖像對是否屬于同一類
siamese convolutional neural networks
1. are capable of learning generic image features useful for making predictions about unknown class distributions even when very few examples from these new distributions are available;
浙公網安備 33010602011771號