摘要:
常問知識點 閱讀全文
posted @ 2024-07-09 15:01
david_cloud
閱讀(9)
評論(0)
推薦(0)
摘要:
1. 背景 絕大數(shù)事故發(fā)生在應(yīng)用上下線發(fā)布階段,所以要盡可能避免發(fā)布過程中由于應(yīng)用自身代碼問題對用戶造成的影響。 業(yè)界發(fā)布規(guī)范: 可灰度(可以通過 Argo Rollout/OpenKruise 支持) 可觀測(容器狀態(tài)、容器速查大盤、發(fā)布/配置變更/K8s 事件、業(yè)務(wù)日志/業(yè)務(wù)埋點、jstack/ 閱讀全文
posted @ 2024-07-09 14:53
david_cloud
閱讀(51)
評論(0)
推薦(0)
摘要:
1. 什么是 HPA ? HPA(Horizontal Pod Autoscaler)是 Kubernetes 中的一種資源自動伸縮機(jī)制,用于根據(jù)某些指標(biāo)動態(tài)調(diào)整 Pod 的副本數(shù)量。 2. 什么時候需要 HPA ? 負(fù)載波動:當(dāng)您的應(yīng)用程序的負(fù)載經(jīng)常發(fā)生波動時,HPA 可以自動調(diào)整 Pod 的副本 閱讀全文
posted @ 2024-07-09 14:48
david_cloud
閱讀(47)
評論(0)
推薦(0)
摘要:
1. 上價值 從虛擬機(jī)到 Kubernetes 轉(zhuǎn)變的收益 更高效的利用系統(tǒng)資源:虛擬化本身大概占用10%的宿主機(jī)資源消耗,在集群規(guī)模足夠大的時候,這是一塊非常大的資源浪費。 保證環(huán)境的一致性:環(huán)境不一致問題是容器鏡像出現(xiàn)之前業(yè)界的通用問題,不利于業(yè)務(wù)的快速上線和穩(wěn)定性。 加快資源交付和擴(kuò)縮容:虛擬 閱讀全文
posted @ 2024-07-09 14:46
david_cloud
閱讀(37)
評論(0)
推薦(0)
摘要:
1. 影響范圍和故障時間線 影響范圍 ... 影響時間線(2022-xx-xx xx:xx ~ 2022-xx-xx xx:xx) ... 2. 故障發(fā)生原因 故障現(xiàn)象 根因分析 ... 3. Why 分析 5 why 分析法 4. 后續(xù) TODO 閱讀全文
posted @ 2024-07-09 14:44
david_cloud
閱讀(99)
評論(0)
推薦(0)
摘要:
問題:鏡像倉庫認(rèn)證 secret 創(chuàng)建后,被 rancher 更新為 舊密碼 解決方式:刪除 項目id 相對應(yīng)的namespace 下的 secret,停止自動同步更新 原因:之前 創(chuàng)建 鏡像倉庫憑證 是通過 rancher UI 創(chuàng)建,作用域為 項目下所有命令空間 排查思路: 查看 secrets 閱讀全文
posted @ 2024-07-09 14:37
david_cloud
閱讀(12)
評論(0)
推薦(0)
摘要:
Kubernetes中namespace有兩種常見的狀態(tài),即Active和Terminating狀態(tài),其中Terminating狀態(tài)一般會比較少見,當(dāng)對應(yīng)的命名空間下還存在運行的資源,但該命名空間被刪除時才會出現(xiàn)所謂的Terminating狀態(tài),這種情況下只要等待Kubernetes本身將命名空間下 閱讀全文
posted @ 2024-07-09 14:36
david_cloud
閱讀(20)
評論(0)
推薦(0)
摘要:
Pod 驅(qū)逐場景總結(jié) 從一個 SRE 角度看, Pod 驅(qū)逐分為兩種情況: 較安全驅(qū)逐 & 提高穩(wěn)定性的良性驅(qū)逐 API 發(fā)起驅(qū)逐,典型案例:kubectl drain Node Not Ready 時,Controller Manager 發(fā)起的驅(qū)逐 有風(fēng)險的驅(qū)逐 節(jié)點壓力驅(qū)逐 節(jié)點磁盤空間不足、 閱讀全文
posted @ 2024-07-09 14:34
david_cloud
閱讀(55)
評論(0)
推薦(0)
摘要:
Etcd 磁盤空間爆滿解決方案 etcd默認(rèn)的空間配額限制為2G,超出空間配額限制就會影響服務(wù),所以需要定期清理 設(shè)置環(huán)境變量 ETCD_CA_CERT="/etc/kubernetes/pki/etcd/ca.crt" ETCD_CERT="/etc/kubernetes/pki/etcd/ser 閱讀全文
posted @ 2024-07-09 14:32
david_cloud
閱讀(92)
評論(0)
推薦(0)
摘要:
目的 本次演練旨在測試 Kubernetes 的 etcd 高可用性,檢驗是否能夠在其中一個 etcd 節(jié)點發(fā)生故障的情況下,其他 etcd 節(jié)點能夠接管其工作,確保集群仍能正常運行。 集群架構(gòu) 演練場景 在一個三節(jié)點的 Kubernetes 集群中,我們將模擬其中一個 etcd 節(jié)點的故障,觀察剩 閱讀全文
posted @ 2024-07-09 14:29
david_cloud
閱讀(50)
評論(0)
推薦(0)

浙公網(wǎng)安備 33010602011771號