-
崇志宏:强化学习和深度强化学习
深度学习在强化学习方面的应用所产生的深度强化学习取得快速发展。如何解释深度强化学习优势产生的原因是理解技术的基本方法。强化学习的问题ntel ab数据&智能实验室Agentstate rewardS,||R+=PS=1=8:8:1anR,+1, Environment5o,A0,B1,S1,41,,S2,A2,R3东南大学数据与智能实验室(D& nte lab)强化学习算法的基本范式ntel ab数据&智能实验室Generalized Policy Iteration1. Policy Iteration2. Value iterationevaluationTTU,丌率丌~ greedy(Vdyugreimprovement1. Policy Evaluation博弈2. Policy Improvement1.策略评价逼近策略价值2.策略提高远离策略价值Elements of rlntel ab数据&智能实验室o Policy Valuation Oriented MethodsModel-based or free estimationExp ion or Exploit0 nl ine or0千f|ineExpans ion and Backup Operation(q*)maxnax东南大学数据与智能实验室(D& Inte lab)Position of rlntel ab数据&智能实验室Long short TermPixeICNNPixeIRNNMemory(LSTM)ConvolutionNetworks withFully ConnectedNeural NetworkAutoregressiveNetworkMemoryNetwork(CNN)(FCN)StochasticGradientSecond OrderEarth Mover DistanceDescent (SGD)Algorithms(EMD)NetworksyRt+k+1 St=s, At=ak=0
- 2020-12-09下载
- 积分:1
-
伊藤算法函数优化源代码
伊藤算法同遗传算法一样,是一种粒子优化算法,该算法模拟花粉的布朗运动,满足维纳过程,设置粒子的漂移和波动,漂移代表解的趋势项,即朝好的解漂移;波动代表振动项,即在解的周围波动,寻找更好的解。同时还有温度的影响,模拟的是退火过程。 伊藤算法能够解决函数优化问题,组合优化问题等NP难问题,而且程序简单,迭代次数少就能找到很好的解,特别适合函数优化问题,所以是一个非常好的优化算法。
- 2021-05-07下载
- 积分:1
-
基于matlab的汽车牌照识别
使用MATLAB开发了一套车牌识别系统,完成车牌定位、车牌字符分割和车牌字符识别等功能(内含完整源代码和毕设论文以及答辩PPT)
- 2020-12-03下载
- 积分:1
-
交互式多模型滤波Imm代码
一个简单的交互式多模型滤波程序,跟踪一个平面内运动目标点,包括卡尔曼滤波程序
- 2020-12-10下载
- 积分:1
-
高校实验室管理系统(毕业设计)
毕业设计!!!!与大家分享了!开发工具:Microsoft Visual Studio 2005+sql server 2005.功能完整!!!!!!!!!(附论文)
- 2020-12-04下载
- 积分:1
-
C程序设计语言(第2版·新版)(英文版+中文版+习题解答).zip
C程序设计语言(第2版·新版)(英文版+中文版+习题解答).zip
- 2019-10-10下载
- 积分:1
-
车道线检测MFC程序
车道线检测的MFC程序,其中应用了opencv,并编写了MFC界面。
- 2020-11-30下载
- 积分:1
-
无线信道建模
无线信道建模的讲解,我们学校老师自己总结的,内附matlab程序
- 2020-12-09下载
- 积分:1
-
OFDM峰平比及matlab程序仿真
正交频分复用(OFDM)技术是一种可以有效对抗符号间干扰(ISI)的高速数据传输技术。OFDM是一种特殊的多载波调制方式,它的基本思想是将高速传输的数据流通过串/并转换,变成在若干个正交的窄带子信道上并行传输的低速数据流。OFDM接收机有三个关键技术:信道估计技术,降低峰均比(PAPR)技术和同步技术。OFDM技术能有效的对抗多径衰落等,有着诸多的优点,但是OFDM有一个发展瓶颈,即OFDM信号的峰均功率比很大,很容易导致OFDM信号的交调失真和系统性能的下降。因而如何降低OFDM信号的峰均功率比一直是OFDM技术的一个研究热点问题。
- 2020-11-28下载
- 积分:1
-
计算PAPR 的CCDF的MATLAB程序源码
非常简单的计算CCDF的matlab函数,调用方便
- 2020-12-02下载
- 积分:1