摘要:
一、下載安裝包: https://nodejs.org/zh-cn/download/ 注:根據自己電腦系統及位數選擇,我的電腦是Windows系統、64位、想下載穩定版的.msi(LTS為長期穩定版)這里選擇windows64位.msi格式安裝包。 .msi和.zip格式區別: .msi是Wind
閱讀全文
摘要:
1、在定義生成器的函數中,對于第一層卷積層,輸入256*256*3的遮擋圖,使用64個4*4的卷積核,步長為2,same填充,對于輸出的圖像尺寸一開始總覺得是256*256,因為一直覺得same填充時尺寸不發生改變,但是查了查步長的作用發現即使是用same填充,步長也會影響尺寸的大小,所以總結得出:
閱讀全文
摘要:
1、數據處理技巧:Batch Normalization(批歸一化)、Data Augmentation(數據增強) 2、上采樣和下采樣 三、Epoch、Batch以及Batch size的設定 Epoch(時期): 當一個完整的數據集通過了神經網絡一次并且返回了一次,這個過程稱為一次>epoch。
閱讀全文
摘要:
LeNet-5 LeNet-5模型是專門為手寫數字識別而設計的經典卷積神經網絡。 從上圖可以看出,LeNet-5總共由輸入層、卷積層、池化層、卷積層、池化層、全連接層、全連接層、輸出層組成。 1、輸入層:一張32*32的灰度圖像,只有一個顏色通道,深度為1。 2、卷積層:將輸入與6個高為5,寬為5,
閱讀全文
摘要:
Stride的作用:是成倍縮小尺寸,而這個參數的值就是縮小的具體倍數,比如步幅為2,輸出就是輸入的1/2;步幅為3,輸出就是輸入的1/3。 卷積神經網絡(CNN)有卷積層和池化層結構,這兩層結構是CNN的重要組成部分。 卷積層就是通過若干個卷積核對上一層輸入進行掃描,從而在較大程度上提取原始像素矩陣
閱讀全文
摘要:
論文鏈接 https://openaccess.thecvf.com/content_cvpr_2016/papers/Pathak_Context_Encoders_Feature_CVPR_2016_paper.pdf 簡介 作者提出了一種基于上下文像素預測的無監督視覺特征學習算法,它既完成了特
閱讀全文
摘要:
pip install opencv_python -i http://pypi.douban.com/simple --trusted-host pypi.douban.com
閱讀全文
摘要:
張量可以理解為n維數組或矩陣。在NumPy數組中,一個float32或float64的數字就是一個標量(零維張量),可以用ndim查看張量的維度。 向量(一維張量)是由數字組成的數組。 矩陣(二維張量)是由向量組成的數組。
閱讀全文
摘要:
一、發展歷程: 二、基于傳統機器學習的目標檢測方式: 在梳理深度學習目標檢測前,個人還是喜歡首先梳理一下傳統機器學習的目標檢測方式,因為深度學習的目標檢測方式是在傳統機器學習目標檢測方式的基礎上進行發展的。個人在傳統的機器學習目標檢測方法也是進行過一些嘗試,但是這種方法的瓶頸太明顯了,后期就被淘汰了
閱讀全文