Machine Learning - Regression - Week2

linear regression with multiple features

the basic progress for this type of ML problem

簡單的線性回歸是一個因變量一個自變量，由于一個變量很難解釋一個特征的全部信息，所以我們往往需要考慮多個特征。
首先我們來看看多項式回歸

$y_i = w_0 + w_1x_i+w_2x_i^2+...+w_px_i^p+\epsilon_i$
我們可以將每個多項式看做一個特征，通常第一個特征默認為1.如下圖

更為一般的，我們可以將每個特征看做一個原始特征的函數

接下來我們來具體看看多元回歸相關的一些概念與方法

$x [j]$ :表示第j個特征
$x_i$ :表示第i個樣本

當我們對變量進行解釋時，我們選擇其中一個變量，固定所有其他的變量，則該變量的系數表示每增加一單位該變量，y的改變。

注意：當為多項式回歸時，我們無法固定其他變量不變，也就無法解釋其系數。

Step4：求解方法
方法一：閉式解法（也就是解析解法）（closed-form solution）
這種方法是求的解析解，可以求出一個具體的表達式，可以通過帶入具體數值來進行獲得
求解思路：讓梯度等于0

這種方法求解需要注意兩個問題：

方法二：梯度下降法（Gradient descent）
這種方法求的是一個數值近似解，即需要具體的數據來計算
基本思路：不斷同梯度下降最快的方向進行，知道收斂（一般到 $10^-3$ ）
注意：
當多個特征時，我們要同時更新所有的特征

posted @ 2022-08-27 11:09 JOJO數據科學閱讀(19) 評論(0) 收藏舉報

刷新頁面返回頂部