<output id="qn6qe"></output>

    1. <output id="qn6qe"><tt id="qn6qe"></tt></output>
    2. <strike id="qn6qe"></strike>

      亚洲 日本 欧洲 欧美 视频,日韩中文字幕有码av,一本一道av中文字幕无码,国产线播放免费人成视频播放,人妻少妇偷人无码视频,日夜啪啪一区二区三区,国产尤物精品自在拍视频首页,久热这里只有精品12

      基于Qlearning強化學習的Cart-Pole推車桿平衡控制系統matlab仿真

       

       

       

       

       

       

       

       

       

       

       

       

       

       

       

       

       

       

       

       

      1.算法仿真效果

      matlab2022a仿真結果如下(完整代碼運行后無水印):

      1

      2

      3

      4

      5

      通過不斷與環境交互并更新Q值函數,智能體能夠逐漸學習到在不同狀態下的最優動作,從而實現桿的平衡控制。

      仿真操作步驟可參考程序配套的操作視頻。

      2.算法涉及理論知識概要

      強化學習作為一種強大的機器學習范式,為解決這類復雜的控制問題提供了有效的途徑。其中,Q-learning算法因其簡單性和通用性,在Cart-Pole推車桿平衡控制系統中得到了廣泛應用。本文將深入探討基于Q-learning強化學習的Cart-Pole推車桿平衡控制系統的原理。

      Cart-Pole物理模型

             Cart-Pole系統由一個可在水平軌道上移動的推車和一根通過鉸鏈連接在推車上的桿組成。假設推車的質量為

      6

      這些方程描述了系統狀態隨時間的變化規律,是理解和控制Cart-Pole系統的基礎。

      Cart-Pole推車桿平衡控制系統的目標是設計一個控制器,通過施加合適的力F,使桿在盡可能長的時間內保持垂直平衡狀態(即 θ≈0),同時確保推車不超出軌道邊界。在實際應用中,這一問題的解決方案可以推廣到機器人平衡控制、火箭姿態調整等領域。

      Q-learning強化學習
      強化學習是一種通過智能體(Agent)與環境(Environment)進行交互,以最大化累積獎勵(Reward)為目標的機器學習方法。在Cart-Pole系統中,智能體就是負責控制推車運動的控制器,環境則是Cart-Pole系統本身。
      7

      Q值函數的更新規則為:

      8

      控制每次更新的步長。學習率越大,新的經驗對Q值的影響越大;學習率越小,Q值的更新越依賴于之前的估計。

      在訓練完成后,使用訓練好的Q表進行測試。在測試過程中,智能體采用貪心策略(即 ?=0)選擇動作,觀察Cart-Pole系統在不同初始狀態下的平衡控制效果。可以通過計算系統保持平衡的平均時間、成功平衡的次數等指標來評估控制器的性能。

      3.MATLAB核心程序

      .............................................................
      % 繪制新的狀態
      figure(1);
      % 計算桿的兩個端點的 x 坐標
      X = [Pos_car, Pos_car+Lens*sin(Ang_car)];
      % 計算桿的兩個端點的 y 坐標
      Y = [0.1, 0.1+Lens*cos(Ang_car)];
      % 繪制小車,用綠色矩形表示
      obj=rectangle('Position',[Pos_car-0.1,0,0.2,0.1],'facecolor','g');
      hold on
      % 繪制桿,用藍色粗線表示
      obj2=plot(X,Y,'b','LineWidth',4);
      hold on
      % 設置坐標軸范圍
      axis([-0.5 0.5 0 2]);
      % 根據外力方向顯示圖例
      if F > 0
         legend('>','FontSize', 15);
      else
         legend('<','FontSize', 15);
      end
      % 更新圖形窗口的標題,顯示訓練次數和最大成功次數
      title(strcat('訓練次數',num2str(iters)));
      hold off
       
       
      % 繪制平均 Q 值隨訓練次數的變化曲線
      figure
      plot(Q_save);
      % 設置 x 軸標簽
      xlabel('訓練次數');
      % 設置 y 軸標簽
      ylabel('Q value收斂值');
       
      % 繪制子圖
      figure
      % 繪制第一個子圖,顯示桿的角速度隨訓練次數的變化
      subplot(221);
      plot(Vang_car_save);
      % 設置子圖標題
      title('pole角速度');
       
      % 繪制第二個子圖,顯示桿的角度隨訓練次數的變化
      subplot(222);
      plot(Ang_car_save);
      % 設置子圖標題
      title('pole角度');
       
      % 繪制第三個子圖,顯示小車的速度隨訓練次數的變化
      subplot(223);
      plot(V_car_save);
      % 設置子圖標題
      title('pole速度');
       
      % 繪制第四個子圖,顯示小車的位置隨訓練次數的變化
      subplot(224);
      plot(Pos_car_save);
      % 設置子圖標題
      title('pole位置');
      0Z_016m
      

        

       

      posted @ 2025-10-31 22:48  我愛C編程  閱讀(51)  評論(0)    收藏  舉報
      主站蜘蛛池模板: 国产亚洲精品自在久久vr| 在线观看热码亚洲AV每日更新| 免费看黄片一区二区三区| 中文字幕日韩人妻一区| 免费视频国产在线观看| 精品精品国产自在97香蕉| 黄色A级国产免费大片视频| 夏津县| 成人精品一区二区三区四| 免费人成视频网站在线18| 海宁市| 国产高清一区二区不卡| 亚洲第一极品精品无码久久| 欧美成人aaa片一区国产精品| 吃奶还摸下面动态图gif| 国产午夜亚洲精品福利| 亚洲国产熟女一区二区三区| 亚洲精品无amm毛片| 成人av久久一区二区三区| 日本久久99成人网站| 国产福利精品一区二区| 无码av人片在线观看天堂| 无套后入极品美女少妇| 中国老熟女重囗味hdxx| 色狠狠综合天天综合综合| 亚洲精品午夜国产VA久久成人| 二区三区亚洲精品国产| 国产超高清麻豆精品传媒麻豆精品| 亚洲av日韩av永久无码电影| 无码国产一区二区三区四区| 日韩精品av一区二区三区| 色综合网天天综合色中文| 午夜综合网| 亚洲成人av一区二区| 亚洲AV成人片不卡无码| 91中文字幕一区二区| 国产乱码精品一区二区三| 国产综合视频一区二区三区| 中文字幕久久精品波多野结| 成人午夜精品无码区久久| 区一区二区三区中文字幕|