動(dòng)手學(xué)深度學(xué)習(xí)-第一章引言
在DATAwhale的組織下,開(kāi)始新的一輪深度學(xué)習(xí),感謝組織,感謝沐神.
機(jī)器學(xué)習(xí)(machine learning,ML)是一類強(qiáng)大的可以從經(jīng)驗(yàn)中學(xué)習(xí)的技術(shù)。 通常采用觀測(cè)數(shù)據(jù)或與環(huán)境交互的形式,機(jī)器學(xué)習(xí)算法會(huì)積累更多的經(jīng)驗(yàn),其性能也會(huì)逐步提高。
- 數(shù)據(jù)
- 遵循獨(dú)立同分布(independently and identically distributed, i.i.d.)(大多數(shù)情況,假設(shè)的前題)
- 由一組稱為特征(features,或協(xié)變量(covariates))的屬性組成
- 器學(xué)習(xí)模型會(huì)根據(jù)這些屬性進(jìn)行預(yù)測(cè)
擁有越多數(shù)據(jù)的時(shí)候,工作就越容易。
還需要正確的數(shù)據(jù)
- 模型
- 轉(zhuǎn)換數(shù)據(jù) 將輸入數(shù)據(jù)通過(guò)模型輸出相應(yīng)數(shù)據(jù)
- 目標(biāo)
- 定義模型的優(yōu)劣程度的度量,這個(gè)度量在大多數(shù)情況是“可優(yōu)化”的
- 最常見(jiàn)的損失函數(shù)是平方誤差
- 算法
- 搜索出最佳參數(shù),以最小化損失函數(shù)
- 搜索出最佳參數(shù),以最小化損失函數(shù)
2.機(jī)器學(xué)習(xí)分類
2.1監(jiān)督學(xué)習(xí)

2.1.1回歸
任何有關(guān)“有多少”的問(wèn)題很可能就是回歸問(wèn)題
2.1.2分類
“哪一個(gè)”的問(wèn)題叫做分類(classification)問(wèn)題
2.1.3標(biāo)注
學(xué)習(xí)預(yù)測(cè)不相互排斥的類別的問(wèn)題稱為多標(biāo)簽分類(multi-label classification)
2.1.4搜索
在海量搜索結(jié)果中找到用戶最需要的那部分
2.1.5推薦
與搜索和排名相關(guān)的問(wèn)題是推薦系統(tǒng)(recommender system),它的目標(biāo)是向特定用戶進(jìn)行“個(gè)性化”推薦
2.1.6序列
序列學(xué)習(xí)需要攝取輸入序列或預(yù)測(cè)輸出序列,或兩者兼而有之。 具體來(lái)說(shuō),輸入和輸出都是可變長(zhǎng)度的序列
2無(wú)監(jiān)督學(xué)習(xí)
不含有“目標(biāo)”的機(jī)器學(xué)習(xí)問(wèn)題通常被為無(wú)監(jiān)督學(xué)習(xí)
- 聚類
- 主成分分析
- 因果關(guān)系
- 生成對(duì)抗網(wǎng)絡(luò)
2.3與環(huán)境互動(dòng)

2.4強(qiáng)化學(xué)習(xí)
在每個(gè)特定時(shí)間點(diǎn),智能體從環(huán)境接收一些觀察(observation),并且必須選擇一個(gè)動(dòng)作(action),然后通過(guò)某種機(jī)制(有時(shí)稱為執(zhí)行器)將其傳輸回環(huán)境,最后智能體從環(huán)境中獲得獎(jiǎng)勵(lì)(reward)。 此后新一輪循環(huán)開(kāi)始,智能體接收后續(xù)觀察,并選擇后續(xù)操作,依此類推。

posted on 2023-03-19 09:04 學(xué)到老必須的 閱讀(111) 評(píng)論(0) 收藏 舉報(bào)
浙公網(wǎng)安備 33010602011771號(hào)