【題目1】
表1所示的數據集表示豌豆種子在不同環境下能否發芽情況。豌豆種子自身有形狀、大小和種皮顏色等特征,外部影響環境有土壤、水分和日照等特征。試通過所示數據集構建ID3決策樹并根據最后一行測試數據預測該豌豆能否發芽。
【要求】
1.畫出完整決策樹;
2.預測測試1用例的發芽情況;
3.請大家在博客中直接完成或在作業本上完成后拍照上傳。
表1 豌豆種子在不同環境下發芽情況數據表
| 編號 | 形狀 | 顏色 | 大小 | 土壤 | 水份 | 日照 | 發芽 |
| 1 | 圓形 | 灰色 | 飽滿 | 酸性 | 多 | 12小時以上 | 否 |
| 2 | 圓形 | 白色 | 縊縮 | 堿性 | 少 | 12小時以上 | 是 |
| 3 | 皺形 | 白色 | 飽滿 | 堿性 | 多 | 12小時以上 | 否 |
| 4 | 皺形 | 灰色 | 飽滿 | 酸性 | 多 | 12小時以下 | 是 |
| 5 | 圓形 | 白色 | 縊縮 | 堿性 | 少 | 12小時以下 | 是 |
| 6 | 皺形 | 灰色 | 縊縮 | 酸性 | 少 | 12小時以上 | 是 |
| 7 | 圓形 | 白色 | 飽滿 | 酸性 | 少 | 12小時以下 | 是 |
| 8 | 皺形 | 灰色 | 縊縮 | 堿性 | 多 | 12小時以下 | 否 |
| 9 | 圓形 | 灰色 | 縊縮 | 堿性 | 少 | 12小時以上 | 否 |
| 測試1 | 圓形 | 白色 | 飽滿 | 堿性 | 多 | 12小時以下 | ? |
【題目2】
表2是一個由16個樣本組成的感冒診斷訓練數據集??。每個樣本由四個特征組成,即體溫、流鼻涕、肌肉疼、頭疼。其中體溫特征有3個可能取值:普通、較高、非常高;流鼻涕,肌肉疼、頭疼分別有兩個可能取值:是、否;樣本的標注值為是否感冒。試用ID3或C4.5算法通過訓練數據集??建立一個用于判斷是否感冒的決策樹。
【要求】
1.畫出完整決策樹;
表2 感冒診斷數據表

【要求】
1.寫出決策樹實現的基本步驟和關鍵公式;
2.寫出決策樹實現的詳細計算過程;
3.本題實現可采用ID3或C4.5算法,建立使用C4.5算法;
4.請大家在博客中直接完成或在作業本上完成后拍照上傳。
題一

題二

浙公網安備 33010602011771號