<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      Karmada v1.15 版本發(fā)布!多模板工作負載資源感知能力增強

      本文分享自華為云社區(qū)《Karmada v1.15 版本發(fā)布!多模板工作負載資源感知能力增強》,作者:云容器大未來。

      Karmada 是開放的多云多集群容器編排引擎,旨在幫助用戶在多云環(huán)境下部署和運維業(yè)務(wù)應(yīng)用。憑借兼容 Kubernetes 原生 API 的能力,Karmada可以平滑遷移單集群工作負載,并且仍可保持與 Kubernetes 周邊生態(tài)工具鏈協(xié)同。

      Karmada v1.15版本現(xiàn)已發(fā)布,本版本包含下列新增特性:

      ● 多模板工作負載的資源精確感知

      ● 集群級故障遷移功能增強 

      ● 結(jié)構(gòu)化日志

      ● Karmada 控制器和調(diào)度器性能顯著提升

      新特性概覽

      多模板工作負載的資源精確感知

      Karmada 利用資源解釋器獲取工作負載的副本數(shù)和資源請求,并據(jù)此計算工作負載所需資源總量,從而實現(xiàn)資源感知調(diào)度,聯(lián)邦配額管理等高階能力。這種機制在傳統(tǒng)的單模板工作負載中表現(xiàn)良好。然而,許多AI大數(shù)據(jù)應(yīng)用的工作負載 CRD(如 FlinkDeployments,PyTorchJob 和 RayJob 等)包含多個 Pod 模板或組件,每個組件都有獨特的資源需求。由于資源解釋器僅能處理單個模板的資源請求,無法準確反映不同模板間的差異,導(dǎo)致多模板工作負載的資源計算不夠精確。

      在這個版本中,Karmada 強化了對多模板工作負載的資源感知能力,通過擴展資源解釋器,Karmada 現(xiàn)在可以獲取同一工作負載不同模板的副本數(shù)和資源請求,確保數(shù)據(jù)的精確性。這一改進也為多模板工作負載的聯(lián)邦配額管理提供了更加可靠和精細的數(shù)據(jù)支持。

      假設(shè)你部署了一個 FlinkDeployment,其資源相關(guān)配置如下:
      spec:
        jobManager:
          replicas: 1
          resource:
            cpu: 1
            memory: 1024m
        taskManager:
          replicas: 1
          resource:
            cpu: 2
            memory: 2048m

      通過 ResourceBinding,你可以查看資源解釋器解析出的 FlinkDeployment 各個模板的副本數(shù)以及資源請求。

      spec:
        components:
        - name: jobmanager
          replicaRequirements:
            resourceRequest:
              cpu: "1"
              memory: "1.024"
          replicas: 1
        - name: taskmanager
          replicaRequirements:
            resourceRequest:
              cpu: "2"
              memory: "2.048"
          replicas: 1

      此時,F(xiàn)ederatedResourceQuota 計算的 FlinkDeployment 占用的資源量為:

       status:
          overallUsed:
            cpu: "3"
            memory: 3072m

      注意:該特性??目前處于 Alpha 階段,需要啟用 MultiplePodTemplatesScheduling 特性開關(guān)??才能使用。

      隨著多模板工作負載在云原生環(huán)境中的廣泛應(yīng)用,Karmada 致力于對其提供更強有力的支持。在接下來的版本中,我們將基于此功能進一步加強對多模板工作負載的調(diào)度支持,提供更加細粒度的資源感知調(diào)度——敬請期待更多更新!

      更多有關(guān)此功能的資料請參考:多 Pod 模板支持

      集群級故障遷移功能增強

      在之前的版本中,Karmada 提供了基本的集群級故障遷移能力,能夠通過自定義的故障條件觸發(fā)集群級別的應(yīng)用遷移。為了滿足有狀態(tài)應(yīng)用在集群故障遷移過程中保留其運行狀態(tài)的需求,Karmada 在 v1.15 版本支持了集群故障遷移的應(yīng)用狀態(tài)中繼機制。對于大數(shù)據(jù)處理應(yīng)用(例如 Flink),利用此能力可以從故障前的 checkpoint 重新啟動,無縫恢復(fù)到重啟前的數(shù)據(jù)處理狀態(tài),從而避免數(shù)據(jù)重復(fù)處理。

      社區(qū)在 PropagationPolicy/ClusterPropagationPolicy API 中的 .spec.failover.cluster 下引入了一個新的 StatePreservation 字段, 用于定義有狀態(tài)應(yīng)用在故障遷移期間保留和恢復(fù)狀態(tài)數(shù)據(jù)的策略。結(jié)合此策略,當應(yīng)用從一個故障集群遷移到另一個集群時,能夠從原始資源配置中提取關(guān)鍵數(shù)據(jù)。

      狀態(tài)保留策略 StatePreservation 包含了一系列 StatePreservationRule 配置,通過 JSONPath 來指定需要保留的狀態(tài)數(shù)據(jù)片段,并利用關(guān)聯(lián)的 AliasLabelName 將數(shù)據(jù)傳遞到遷移后的集群。

      以 Flink 應(yīng)用為例,在 Flink 應(yīng)用中,jobID 是一個唯一的標識符,用于區(qū)分和管理不同的 Flink 作業(yè)(jobs)。當集群發(fā)生故障時,F(xiàn)link 應(yīng)用可以利用 jobID 來恢復(fù)故障前作業(yè)的狀態(tài),從故障點處繼續(xù)執(zhí)行。具體的配置和步驟如下:

      apiVersion: policy.karmada.io/v1alpha1
      kind: PropagationPolicy
      metadata:
        name: foo
      spec:
        #...
        failover:
          cluster:
            purgeMode: Directly
            statePreservation:
              rules:
                - aliasLabelName: application.karmada.io/cluster-failover-jobid
                  jsonPath: "{ .jobStatus.jobID }"
      1. 遷移前,Karmada 控制器將按照用戶配置的路徑提取 job ID。
      2. 遷移時,Karmada 控制器將提取的 job ID 以 label 的形式注入到 Flink 應(yīng)用配置中,比如 application.karmada.io/cluster-failover-jobid : <jobID>。
      3. 運行在成員集群的 Kyverno 攔截 Flink 應(yīng)用創(chuàng)建請求,并根據(jù) jobID 獲取該 job 的 checkpoint 數(shù)據(jù)存儲路徑,比如 /<shared-path>/<job-namespace>/<jobId>/checkpoints/xxx,然后配置 initialSavepointPath 指示從save point 啟動。
      4. Flink 應(yīng)用根據(jù) initialSavepointPath 下的 checkpoint 數(shù)據(jù)啟動,從而繼承遷移前保存的最終狀態(tài)。
      該能力廣泛適用于能夠基于某個 save point 啟動的有狀態(tài)應(yīng)用程序,這些應(yīng)用均可參考上述流程實現(xiàn)集群級故障遷移的狀態(tài)中繼。 注意:該特性??目前處于 Alpha 階段,需要啟用 StatefulFailoverInjection 特性開關(guān)??才能使用。

      功能約束:

      1. 應(yīng)用必須限定在單個集群中運行;
      2. 遷移清理策略(PurgeMode)限定為 Directly,即需要確保故障應(yīng)用在舊集群上刪除之后再在新集群中恢復(fù)應(yīng)用,確保數(shù)據(jù)一致性。

      結(jié)構(gòu)化日志

      日志是系統(tǒng)運行過程中記錄事件、狀態(tài)和行為的關(guān)鍵工具,廣泛用于故障排查、性能監(jiān)控和安全審計。Karmada 組件提供豐富的運行日志,幫助用戶快速定位問題并回溯執(zhí)行場景。在先前版本中,Karmada 僅支持非結(jié)構(gòu)化的文本日志,難以被高效解析與查詢,限制了其在現(xiàn)代化觀測體系中的集成能力。

      Karmada 在 1.15 版本引入了結(jié)構(gòu)化日志支持,可通過 --logging-format=json 啟動參數(shù)配置 JSON 格式輸出。結(jié)構(gòu)化日志示例如下:

      {
        "ts":“日志時間戳”,
        "logger":"cluster_status_controller",
        "level": "info",
        "msg":"Syncing cluster status",
        "clusterName":"member1"
      }

      結(jié)構(gòu)化日志的引入顯著提升了日志的可用性與可觀測性:

      ● 高效集成:可無縫對接 Elastic、Loki、Splunk 等主流日志系統(tǒng),無需依賴復(fù)雜的正則表達式或日志解析器。

      ● 高效查詢:結(jié)構(gòu)化字段支持快速檢索與分析,顯著提升故障排查效率。

      ● 可觀察性增強:關(guān)鍵上下文信息(如集群名、日志級別)以結(jié)構(gòu)化字段呈現(xiàn),便于跨組件、跨時間關(guān)聯(lián)事件,實現(xiàn)精準問題定位。

      ● 可維護性提升:結(jié)構(gòu)化日志使開發(fā)者和運維人員在系統(tǒng)演進過程中更易于維護、解析和調(diào)整日志格式,保障日志體系的長期穩(wěn)定與一致性。

      Karmada 控制器和調(diào)度器性能顯著提升

      在本次版本中,Karmada 性能優(yōu)化團隊繼續(xù)致力于提升 Karmada 關(guān)鍵組件的性能,在控制器和調(diào)度器方面取得了顯著進展。

      控制器方面,通過引入優(yōu)先級隊列,控制器能夠在重啟或切主后優(yōu)先響應(yīng)用戶觸發(fā)的資源變更,從而顯著縮短服務(wù)重啟和故障切換過程中的停機時間。

      測試環(huán)境包含 5,000 個 Deployment、2,500 個 Policy 以及 5,000 個 ResourceBinding。在控制器重啟且工作隊列中仍有大量待處理事件的情況下,更新 Deployment 和 Policy。測試結(jié)果顯示,控制器能夠立即響應(yīng)并優(yōu)先處理這些更新事件,驗證了該優(yōu)化的有效性。

      注意:該特性??目前處于 Alpha 階段,需要啟用 ControllerPriorityQueue 特性開關(guān)才能使用。

      調(diào)度器方面,通過減少調(diào)度過程中的冗余計算,降低遠程調(diào)用請求次數(shù),Karmada 調(diào)度器的調(diào)度效率得到了顯著提升。

      測試記錄了在開啟精確調(diào)度組件 karmada-scheduler-estimator 情況下,調(diào)度 5,000 個 ResourceBinding 所用的時間,結(jié)果如下:

      ● 調(diào)度器吞吐量 QPS 從約 15 提升至約 22,性能提升達 46%;

      ● gRPC 請求次數(shù)從約 10,000 次減少至約 5,000 次,降幅達 50%。

      這些測試證明,在 1.15 版本中,Karmada 控制器和調(diào)度器的性能得到了極大提升。未來,我們將繼續(xù)對控制器和調(diào)度器進行系統(tǒng)性的性能優(yōu)化。

      相關(guān)的詳細測試報告,請參考 [Performance] Overview of performance improvements for v1.15 。

      致謝貢獻者

      Karmada v1.15 版本包含了來自 39 位貢獻者的 269 次代碼提交,在此對各位貢獻者表示由衷的感謝:

      貢獻者列表:

      @abhi0324
      @abhinav-1305
      @Arhell
      @Bhaumik10
      @CaesarTY
      @cbaenziger
      @deefreak
      @dekaihu
      @devarsh10
      @greenmoon55
      @iawia002
      @jabellard
      @jennryaz
      @liaolecheng
      @linyao22
      @LivingCcj
      @liwang0513
      @mohamedawnallah
      @mohit-nagaraj
      @mszacillo
      @RainbowMango
      @ritzdevp
      @ryanwuer
      @samzong
      @seanlaii
      @SunsetB612
      @tessapham
      @wangbowen1401
      @warjiang
      @wenhuwang
      @whitewindmills
      @whosefriendA
      @XiShanYongYe-Chang
      @zach593
      @zclyne
      @zhangsquared
      @zhuyulicfc49
      @zhzhuang-zju
      @zzklachlan

      參考資料

      [4] [Performance] Overview of performance improvements for v1.15: https://github.com/karmada-io/karmada/issues/6516

       

      posted @ 2025-09-09 14:03  華為云開發(fā)者聯(lián)盟  閱讀(11)  評論(0)    收藏  舉報
      主站蜘蛛池模板: 日本亚洲一区二区精品| 无码日韩精品91超碰| 激情人妻自拍中文夜夜嗨| 久久亚洲av午夜福利精品一区 | 久青草视频在线免费观看| 在线a亚洲老鸭窝天堂| 亚洲av永久无码精品水牛影视| 亚洲欧洲日产国码久在线| 久久精品国产亚洲AV麻| 亚洲国产精品男人的天堂| 国产国产乱老熟女视频网站97| 国产美女被遭强高潮免费一视频| 亚洲sm另类一区二区三区| 国产成人午夜精品影院| 双峰县| 美日韩精品一区三区二区| 亚洲国产成人综合精品| 亚洲国产日韩一区三区| 亚洲码欧洲码一二三四五| 好吊视频在线一区二区三区| 国产精品区一二三四久久| 无码人妻aⅴ一区二区三区69岛 | 免费无码无遮挡裸体视频在线观看| 激情文学一区二区国产区| 久久精品一区二区东京热| 亚洲aⅴ男人的天堂在线观看| 国产精成人品| 久久国产精品亚洲精品99| 久热伊人精品国产中文| 噜噜噜噜私人影院| 中国国产免费毛卡片| 毛片免费观看视频| 国产精品白浆在线观看免费| 色护士极品影院| 国产成人精品久久一区二区 | 91精品人妻中文字幕色| 中文字幕人妻不卡精品| 国产亚洲精品AA片在线爽| 国产精品国产亚洲区久久| 综合亚洲网| 欧美丰满熟妇xxxx性ppx人交|