【五期李偉平】CCF-A(TMC'22)Enabling Long-Term Cooperation in Cross-Silo Federated Learning: A Repeated Game Perspective
?? 針對重復(fù)執(zhí)行跨筒倉聯(lián)邦學(xué)習(xí)過程中如何保持客戶積極參與(增加訓(xùn)練時使用的數(shù)據(jù)量、減少搭便車行為),本文提出合作的、子博弈完美納什均衡(SPNE)的無限重復(fù)博弈。本文模型將無限時間劃分為一個個時隙,一個時隙進(jìn)行一次子博弈,時隙的具體劃分有更具體的場景決定(例如銀行的一個月或醫(yī)院的一周)。客戶端的成本包括1模型精度損失2計算3通信4服務(wù)端服務(wù)費。本文首先提出一個單階段的博弈,分析博弈均衡;隨后基于單階段博弈計算重復(fù)博弈,得到重復(fù)博弈條件下單階段博弈的均衡;最后通過添加一種懲罰機制,實現(xiàn)子博弈完美均衡的重復(fù)博弈。Zhang, Ning , Q. Ma , and X. Chen . "Enabling Long-Term Cooperation in Cross-Silo Federated Learning: A Repeated Game Perspective." (2022).
?? 從論文寫作上,方案從單階段博弈到重復(fù)博弈再到子博弈完美,層層推進(jìn),思路明確。
?? 默認(rèn)客戶端誠實上報自己的各種信息,沒有考慮錯誤報告的情況。假定各客戶端持有數(shù)據(jù)量相同,且該數(shù)據(jù)量參數(shù)在推導(dǎo)過程中比較重要。
2023年12月27日

浙公網(wǎng)安備 33010602011771號