登录
首页 » Matlab » 回顾近似动态规划及其收敛性

回顾近似动态规划及其收敛性

于 2022-06-12 发布 文件大小:302.29 kB
0 68
下载积分: 2 下载次数: 2

代码说明:

值迭代基于近似适应动态规划 (ADP) 按 infinitehorizon 与确定性的动力学方程和连续状态与动作空间的最优控制问题的近似解进行了研究。学习迭代被分解成一个外循环和内循环。收敛到最优解的外循环迭代的一个相对简单的证明被提供一些新的特点与使用一个新奇的主意。它提出了在迭代期间的价值功能和固定决赛时间最优控制问题的价值函数之间的类比。内部循环利用,避免求解一组非线性方程需要或一个非线性优化问题进行了数值,在每次迭代的 ADP 的策略更新。得到政策更新方程解的唯一性和内循环迭代解的收敛的充分条件。之后,这些结果被形成作为一种学习算法训练神经网络控制器或创建一个查找表来用于具有不同初始条件下的非线性系统的最优控制。最后,一些调查方法的特点进行了数值分析。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • AR
    说明:  AR模型实验数据,在实际工作中测试出来的数据(AR model test data, test out the practical work of data)
    2010-10-24 15:40:53下载
    积分:1
  • MyLOCK
    一个锁屏幕的程序,不再电脑旁时,防止被其他人看你的电脑资料(A lock screen program is no longer next time the computer, and prevent other people to read your computer data)
    2010-03-04 17:42:12下载
    积分:1
  • Matlab-book
    说明:  《Matlab基础及其应用教程》,一本学习matlab的书,特别好,强烈推荐。(&quot Matlab and its application Guide&quot , a school matlab book, particularly good, it is strongly recommended.)
    2011-04-12 10:03:03下载
    积分:1
  • matlab_GUI_2
    matlab_GUI_2
    2011-04-16 14:22:41下载
    积分:1
  • dgds
    This gives BER vs SNR for BPSK theoretical and Simulation
    2014-09-08 12:29:06下载
    积分:1
  • robert
    灰度图像边缘检测中的robert算法的MATLAB仿真实现(MATLAB simulation grayscale image roert edge detection algorithm to achieve)
    2014-11-03 15:29:02下载
    积分:1
  • WCDMAsource
    WCDMA的MATLAB仿真程序,供参考学习 (WCDMA system analysis)
    2014-11-04 21:39:55下载
    积分:1
  • DSP
    任务: 1) 借助MATLAB画出误差性能曲面和误差性能曲面的等值曲线(参考PPT2.1第17页的两幅图); 2) 写出最陡下降法以及LMS算法的计算公式(取 ); 3) 用MATLAB产生方差为0.05, 均值为0白噪音S(n),并画出某次采样得到的波形(即产生任意一个噪声随机序列); 4) 根据 2)中的公式,并利用 3)中产生的S(n),在 1)中的误差性能曲面的等值曲线上叠加画出采用最陡下降法以及LMS法时H(n)的在叠代过程中的轨迹曲线(参考PPT2.1第17页的右下图的曲线1和曲线2)。 5)用MATLAB计算并画出LMS法时 随时间n的变化曲线(对应S(n)的某一次的一次实现)和e(n)波形; 注意:某一次实现的结果并不能从统计的角度反映实验的结果 的正确性,为得到具有统计特性的实验结果,可用足够多次的 实验结果的平均值作为实验的结果。用MATLAB计算并画出 采用LMS法时,J(n)的100次实验结果的平均值随时间n的变 化曲线(即 生成随机噪声信号并计算结果,重复执行100次, 求平均结果)。 6)在 1)中的误差性能曲面的等值曲线上,叠加画出采用LMS法得到的100次实验中的H(n)的平均值的轨迹曲线; (Task: 1 ) Draw with MATLAB error performance surface and surface contour error performance curve ( refer PPT2.1 two chart on page 17 ) 2 ) Write the steepest descent method and the LMS algorithm formula ( take ) 3 ) Using MATLAB to generate variance of 0.05 with a mean of 0 white noise S (n), and draw a particular sampling waveform ( ie, any noise generated random sequence ) 4 ) based on 2 ) of the formula , and use 3 ) generated in S (n), in a ) the error performance curves superimposed on the surface contour plot using the steepest descent method and the LMS method when H (n) the iterative process in the trajectory curve ( refer PPT2.1 page 17 bottom right of the curves 1 and 2 ) . 5 ) using MATLAB LMS method is used calculate and draw the curve with time n (corresponding to S (n) of a first implementation of a ) and e (n) waveform Note : in a first implementation of the results are not reflected from a statistical point of view of accuracy of the experimental results ,)
    2013-11-08 20:09:06下载
    积分:1
  • mamdani_ipmt
    fuzzy controller design for inverted pendulum
    2014-01-25 15:54:50下载
    积分:1
  • 被动悬架模型
    通过simulink搭建了车辆1/4被动悬架模型,以便于选取最优的车辆控制策略(The passive suspension model of vehicle 1/4 is built by Simulink, so as to select the optimal vehicle control strategy)
    2017-10-21 21:23:03下载
    积分:1
  • 696518资源总数
  • 106010会员总数
  • 4今日下载