【題目1】
表1為拖欠貸款人員訓練樣本數據集,使用CART算法基于該表數據構造決策樹模型,并使用表2中測試樣本集確定剪枝后的最優子樹。
| 編號 | 房產狀況 | 婚姻情況 | 年收(千元) | 拖欠貸款 |
| 1 | 是 | 單身 | 125 | 否 |
| 2 | 否 | 已婚 | 100 | 否 |
| 3 | 否 | 單身 | 70 | 否 |
| 4 | 是 | 已婚 | 120 | 否 |
| 5 | 否 | 高異 | 95 | 是 |
| 6 | 否 | 已婚 | 60 | 否 |
| 7 | 是 | 高異 | 220 | 否 |
| 8 | 否 | 單身 | 85 | 是 |
| 9 | 否 | 已婚 | 75 | 否 |
| 10 | 否 | 單身 | 90 | 是 |
| 編號 | 房產狀況 | 婚姻情況 | 年收入(千元) | 拖欠貸款 |
| 1 | 否 | 已婚 | 225 | 否 |
| 2 | 否 | 已婚 | 50 | 是 |
| 3 | 否 | 單身 | 89 | 是 |
| 4 | 是 | 已婚 | 320 | 否 |
| 5 | 是 | 離異 | 150 | 是 |
| 6 | 否 | 離異 | 70 | 否 |
【題目2】
已知一批樣本數據如下表所示,其中x為輸入特征對應值,y為輸出值,請建立該批數據的回歸樹。
| x | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
| y | 5.56 | 5.7 | 5.91 | 6.4 | 6.8 | 7.05 | 8.9 | 8.7 | 9 | 9.05 |
【要求】
1.以上兩題寫出詳細的計算步驟;
2.以上兩題在作業本上完成后拍照上傳。



浙公網安備 33010602011771號