云原生實踐總結(jié)
企業(yè)落地云原生的目的
一句話概括:在保證穩(wěn)定性的前提下,降本增效
目標(biāo)拆解:
-
保障穩(wěn)定性
- 建設(shè)高可用性:基礎(chǔ)組件(Master三大件/Etcd等)高可用、多機(jī)房、多集群、Pod 高可用
- 持續(xù)進(jìn)行風(fēng)險治理:耦合度、故障發(fā)現(xiàn)、容量、容災(zāi)、變更及可運(yùn)維性、安全性
- 建設(shè)可觀測性:Metrics、Logging、Tracing、Events、Chaos、Dashboard、Inspection
- 故障演練:Apiserver 高可用故障演練、Etcd 高可用故障演練、雙機(jī)房切換故障演練
- 預(yù)案建設(shè):Etcd 備份恢復(fù)、Velero 備份恢復(fù)、Master 節(jié)點緊急擴(kuò)容、Etcd 節(jié)點緊急擴(kuò)容、多集群故障遷移
- 性能/容量評估:物理機(jī)性能壓測、Master 組件性能壓測、Etcd 性能壓測、應(yīng)用性能壓測
-
節(jié)約成本
- 推進(jìn)無狀態(tài)應(yīng)用容器化
- 推進(jìn)無狀態(tài)應(yīng)用接入彈性伸縮
- K8s 調(diào)度能力增強(qiáng):預(yù)選、優(yōu)選、重調(diào)度(使資源分配均勻、提高裝箱率、提高資源使用率)
- 持續(xù)進(jìn)行應(yīng)用容量治理:橫向縮容(降副本數(shù))、縱向縮容(降規(guī)格 CPU/MEM)
- 建立資源畫像:調(diào)度和容量治理依賴資源畫像
-
提高效率(平臺能力建設(shè))
- 自動化運(yùn)維平臺(面向開發(fā)):容器生命周期管理、Ingress 生命周期管理、HPA 生命周期管理、擴(kuò)縮容&升降配、容器資源預(yù)留、Java Dump & GCLog、屏蔽/恢復(fù)告警
- 發(fā)布系統(tǒng)(面向開發(fā)):Java/Nodejs/靜態(tài)資源模版、自定義鏡像、自定義模版、滾動發(fā)布、灰度發(fā)布、啟動日志查看
- 堡壘機(jī)(面向開發(fā)):Web 終端、文件管理、日志審計
- SRE 平臺(面向運(yùn)維):集群安裝、集群擴(kuò)縮容、集群升級、插件安裝、Ingress 節(jié)點擴(kuò)縮容、Web Kubectl、集群自動化巡檢、多集群遷移
總結(jié)為下圖,拿走不謝??
![sre-k8s (2)]()
時間是個偉大的作者,必將給出完美的答案。

.png)
浙公網(wǎng)安備 33010602011771號