深度學習基礎課:使用卷積神經網絡識別手寫數字
大家好~我開設了“深度學習基礎班”的線上課程,帶領同學從0開始學習全連接和卷積神經網絡,進行數學推導,并且實現可以運行的Demo程序
線上課程資料:
加QQ群,獲得ppt等資料,與群主交流討論:106047770
本系列文章為線上課程的復盤,每上完一節課就會同步發布對應的文章
本課程系列文章可進入索引查看:
為什么要學習本課
- 為什么要使用卷積神經網絡識別手寫數字?
答:因為相比之前使用全連接層神經網絡識別手寫數字,卷積神經網絡中的卷積層的準確率更高,參數更少,從而使神經網絡的深度能夠更深,最終提高識別的準確率
神經網絡結構
- 結構為:folder+conv+max pooling+flatten+linear+linear
其中folder層的作用是將輸入的Vector數據轉換為Matrix數據;flatten層的作用是將Matrix數據轉換為Vector數據。
這里值得注意的是因為設置conv的zero padding為2,所以雖然input(手寫數字)的寬高為32,但傳給folder層和conv層的寬高為32-2-2=28
代碼實現
- 入口代碼為:Main
出現收斂的問題
- 運行入口代碼,出現訓練無法收斂的問題(正確率一直在10%以下)。這個問題會在下節課解決
浙公網安備 33010602011771號