摘要:
1. 介紹 矩陣向量乘法: A * X = Y, A(M,K) X(K,1) Y(M,1); 實(shí)現(xiàn)多種并行算法及優(yōu)化方法和 cublas 庫 sgemv 的效率對(duì)比。 2. gpu 并行算法介紹 并行算法一:一個(gè)線程計(jì)算一個(gè)結(jié)果元素; 并行算法二:使用合并訪存,需要將輸入數(shù)據(jù)轉(zhuǎn)置; 并行算法三: 合 閱讀全文
posted @ 2025-05-02 22:03
安洛8
閱讀(66)
評(píng)論(0)
推薦(0)

浙公網(wǎng)安備 33010602011771號(hào)