矩陣的計算和應用
在前面關于機器學習中的數學表示一文中提到了矩陣,實際上它是計算機領域非常重要的一種數據結構,但除了CV類(計算機視覺)開發,我們在許多軟件開發場景中卻很少用到它,以至于開始慶幸:
"反正在以前線性代數也沒怎么學好,作用也不大嘛..."
"按說,這種觀點是要受批評的。"
實際上關于矩陣的計算到處都是,只是你鮮少留意罷了?;蛘哒f,當你在使用某個三方庫的時候,它里面已經幫你做好高度封裝,讓你不再顧及里面的細節..
一、矩陣是什么
矩陣可以看做是向量的維度延伸,也就是一個二維數組。
矩陣的數學表示為\(x \in \mathbb{R}^{m*n}\),其中m和n分別代表行和列,其展開的形式如下:
如果矩陣A = 矩陣B,那么那么 A 和 B 的行列結構,以及每個對應位置的元素都是相等的。
特殊的矩陣
- 矩陣為 1*n,只有一行,稱為行向量
- 矩陣為 n*1,只有一列,稱為列向量
- 矩陣為 n*n,行列相同,稱為方陣
二、基本計算
2.1 矩陣加法
對于兩個 \(m \times n\) 矩陣 \(\mathbf{A}\) 和 \(\mathbf{B}\)
其和 \(\mathbf{C} = \mathbf{A} + \mathbf{B}\) 的元素 \(c_{ij}\) 為: $$c_{ij} = a_{ij} + b_{ij}$$
示例
給定矩陣 \(\mathbf{A}\) 和 \(\mathbf{B}\):
應用場景
在圖像處理中,圖像可以表示為一個像素矩陣。將兩張圖像進行融合時,可以通過矩陣加法實現。
融合圖像=圖像A+圖像B
在醫學影像中,CT 和 MRI 圖像可以通過矩陣加法融合,幫助醫生更全面地觀察病灶。
2.2 矩陣減法
對于兩個 \(m \times n\) 矩陣 \(\mathbf{A}\) 和 \(\mathbf{B}\)
其差 \(\mathbf{C} = \mathbf{A} - \mathbf{B}\) 的元素 \(c_{ij}\) 為:\(c_{ij} = a_{ij} - b_{ij}\)
示例
給定矩陣 \(\mathbf{A}\) 和 \(\mathbf{B}\):
應用場景
在安防監控中,連續幀圖像之間的差異可以通過矩陣減法計算:
變化矩陣=當前幀A?前一幀B
如果差異矩陣中某些區域值顯著變化,說明畫面中可能出現了移動物體或異常行為。
2.3 矩陣常量乘法
對于一個常數 \(k\) 和一個 \(m \times n\) 矩陣 \(\mathbf{A}\)
其積 \(\mathbf{C} = k\mathbf{A}\) 的元素 \(c_{ij}\) 為:\(c_{ij} = k \cdot a_{ij}\)
示例
給定矩陣 \(\mathbf{A}\) 和常數 \(k=3\):
應用場景
在圖像處理中,調整圖像亮度可以通過對像素矩陣乘以一個常數:
亮度增強圖像=k?原圖像矩陣,
這會使圖像整體變亮,常用于圖像增強和預處理。
除此之外,在深度學習中,模型的權重矩陣常常需要乘以一個縮放因子(如學習率、正則化系數)來控制訓練過程。
2.4 矩陣乘積
設矩陣 \(A \in \mathbb{R}^{m \times n}\),矩陣\(B \in \mathbb{R}^{n \times p}\),則它們的乘積為:\(C = AB 是一個 m \times p\) 的矩陣。
矩陣 A 和 B可相乘的條件是,A的列數與 B的行數必須相同。乘積 C 的行數與A相同,列數與B相同。
示例
對于乘積 C來說,每個元素 \(c_{ij} 是矩陣 AA 的第 ii 行與矩陣 BB 的第 jj 列的點積:\)
規律
-
乘法不滿足交換律: 一般情況下 AB≠BA(特殊情況除外)
-
乘法滿足結合律與分配律:
- A(BC)=(AB)CA(BC) = (AB)C
- A(B+C)=AB+AC
單位矩陣
單位矩陣(Identity Matrix) 是一種特殊的方陣,其主對角線上的元素全為 1,其余元素全為 0。
單位矩陣記做$ I_n$,對于任意矩陣 \(A \in \mathbb{R}^{n \times n}\),有:
比如,一個 3*3 的單位矩陣,計算過程如下:
2.5 矩陣轉置
矩陣的轉置是將矩陣的行列互換,記作 \(A^T\)。 如果矩陣 \(A \in \mathbb{R}^{m \times n}\),則其轉置 \(A^T∈\mathbb{R}^{n×m}\)
矩陣轉置有許多計算意義,例如在圖像處理中,圖像可以表示為一個像素矩陣。 將圖像矩陣進行轉置,可以實現圖像的90°旋轉(配合行列反轉)。
應用場景
假設你管理一家公司,銷售三種產品:T恤、褲子和鞋子。你有三個銷售渠道:實體店A、實體店B 和網上商店?,F在,你記錄了周一和周二在每個渠道的每種產品的具體銷量。同時,這些產品的價格在不同日期可能會有微調。
我們的目標是計算出每個渠道在周一和周二分別獲得了多少總收入。
1. 銷量矩陣(A)
這個矩陣記錄了每個渠道在周一和周二的每種產品銷量。
- 列代表了銷售渠道(從左到右依次為:實體店A,實體店B,網上商店)。
- 行代表了產品種類。
2. 價格矩陣(B)
這個矩陣記錄了三種產品在周一和周二的價格。
- 行代表了產品種類。
- 列代表了日期(周一,周二)。
3. 矩陣乘法
要計算每個渠道在兩天的總收入,我們將銷量矩陣(A)轉置,然后與價格矩陣(B)相乘,即 \(C=A^TB\)。
4. 計算過程與結果
5. 結果分析
新的結果矩陣清晰地顯示了每個渠道在每一天的總收入:
- 第一行 [3900, 3865]:實體店A 周一總收入為 3900,周二為 3865。
- 第二行 [4700, 4540]:實體店B 周一總收入為 4700,周二為 4540。
- 第三行 [4700, 4599]:網上商店 周一總收入為 4700,周二為 4599。
2.6 Hadamard乘積
矩陣的 Hadamard 乘積,也稱為元素級乘積(element-wise product),是一種特殊的矩陣運算。與矩陣乘法不同,Hadamard 乘積不涉及行與列的點積,而是將兩個相同結構的矩陣中對應位置的元素直接相乘,然后將結果組成一個新的矩陣。
如果兩個矩陣 A 和 B 的維度都是 m×n,它們的 Hadamard 積 \(C=A⊙B\) 的每個元素 \(c_{ij}\) 滿足:
Hadamard 乘積常用于需要對數據進行逐元素加權或篩選的場景。
應用場景
在圖像處理中,圖像數據通常以矩陣形式存儲,矩陣中的每個元素代表一個像素的亮度或顏色值。這時可以使用 Hadamard 乘積來實現圖像遮罩效果,只保留圖像中感興趣的區域。
假設你有一張黑白照片,并想把照片中某一部分變暗或去除。你可以創建一個遮罩矩陣。
-
圖像矩陣 (A): 一個表示圖像像素值的矩陣,例如一個 3x3 矩陣。
\[\text{A} = \begin{bmatrix} 200 & 210 & 205 \\ 180 & 190 & 185 \\ 150 & 160 & 155 \end{bmatrix} \] -
遮罩矩陣 (B): 一個與圖像矩陣同維度的矩陣,其中你想保留的區域元素為1,想遮蓋或變暗的區域元素為0或接近0的值。
\[B = \begin{bmatrix} 1 & 1 & 1 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} \] -
Hadamard 積 (C=A⊙B): 將兩個矩陣逐元素相乘,結果是新的圖像矩陣。
\[\text{C} = \begin{bmatrix} 200\times1 & 210\times1 & 205\times1 \\ 180\times0 & 190\times0 & 185\times0 \\ 150\times0 & 160\times0 & 155\times0 \end{bmatrix} \]\[\text{C} = \begin{bmatrix} 200 & 210 & 205 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end{bmatrix} \]
最終結果是只保留了圖像上半部分的像素,下半部分像素值變為0(全黑),這樣便可以實現了圖像的局部處理功能。
三、小試牛刀
下面使用 numpy 來實現本文提到的這些矩陣運算,包括:加法、減法、常量乘法、矩陣乘積、單位矩陣初始化,以及 Hadamard(元素乘)乘積。
代碼示例
import numpy as np
# 初始化兩個矩陣 A 和 B(3x3)
A = np.array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
B = np.array([[9, 8, 7],
[6, 5, 4],
[3, 2, 1]])
# 1?? 矩陣加法
add_result = A + B
# 2?? 矩陣減法
sub_result = A - B
# 3?? 常量乘法(例如 k = 2)
k = 2
scalar_mul_result = k * A
# 4?? 矩陣乘積(矩陣乘法)
dot_result = np.dot(A, B)
# 5?? 單位矩陣初始化(3x3)
identity_matrix = np.eye(3)
# 6?? Hadamard 乘積(元素乘法)
hadamard_result = A * B
# 輸出結果
print("矩陣 A:\n", A)
print("矩陣 B:\n", B)
print("矩陣加法 A + B:\n", add_result)
print("矩陣減法 A - B:\n", sub_result)
print("常量乘法 k * A:\n", scalar_mul_result)
print("矩陣乘積 A * B:\n", dot_result)
print("單位矩陣 I:\n", identity_matrix)
print("Hadamard 乘積 A HM B:\n", hadamard_result)
執行上述程序,輸出結果如下:
矩陣 A:
[[1 2 3]
[4 5 6]
[7 8 9]]
矩陣 B:
[[9 8 7]
[6 5 4]
[3 2 1]]
矩陣加法 A + B:
[[10 10 10]
[10 10 10]
[10 10 10]]
矩陣減法 A - B:
[[-8 -6 -4]
[-2 0 2]
[ 4 6 8]]
常量乘法 k * A:
[[ 2 4 6]
[ 8 10 12]
[14 16 18]]
矩陣乘積 A * B:
[[ 30 24 18]
[ 84 69 54]
[138 114 90]]
單位矩陣 I:
[[1. 0. 0.]
[0. 1. 0.]
[0. 0. 1.]]
Hadamard 乘積 A HM B:
[[ 9 16 21]
[24 25 24]
[21 16 9]]
四、小結
這篇文章介紹了矩陣的一些基本特征和運算方法,算是對數學不好的小伙伴做個回憶和科普吧,矩陣在機器學習中是一個重要基礎,實際上很多的算法都來源于數學應用。關于矩陣的更高階的一些特性,后面還會繼續更新。
作者: 美碼師(zale)
出處: http://www.rzrgm.cn/littleatp/, 如果喜歡我的文章,請關注我的公眾號
本文版權歸作者和博客園共有,歡迎轉載,但未經作者同意必須保留此段聲明,且在文章頁面明顯位置給出 原文鏈接 如有問題, 可留言咨詢.
浙公網安備 33010602011771號