登录
首页 » c » 增强学习算法

增强学习算法

于 2022-08-10 发布 文件大小:1.45 kB
0 81
下载积分: 2 下载次数: 1

代码说明:

马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。强化学习的故事1:找到最优价值强化学习就是:追求最大回报G追求最大回报G就是:找到最优的策略π∗。策略π∗告诉在状态s,应该执行什么行动a。最优策略可以由最优价值方法v∗(s)或者q∗(s,a)决定

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • Socket_tongxing
    SOCKET通信方面的很实用的程序 很经典(SOCKET communications procedure is very practical classic)
    2007-08-07 16:39:11下载
    积分:1
  • RTC
    实时时钟芯片ds1302驱动程序,并配合8位数码管显示。(Real-time clock chip ds1302 driver, and with the 8-bit digital tube display.)
    2010-08-16 08:56:11下载
    积分:1
  • soru2bandpass
    Bandpass filter simulation analog communication
    2011-09-10 15:39:33下载
    积分:1
  • CurveLab-2.1.1
    curvelet变换matlab程序和c程序(curvelet transform)
    2011-11-24 00:29:20下载
    积分:1
  • socket实现服务器和客户端的通信,实现网络聊天功能
    说明:  通过socket实现服务器和客户端的通信,实现网络聊天功能(Realize the communication between server and client through socket, realize the function of network chat)
    2020-06-18 01:00:01下载
    积分:1
  • 遥控小车电控
    说明:  基于51单片机的遥控小车开发,包括小车程序,以及遥控器程序。(The development of remote control car based on 51 single chip microcomputer includes car program and remote control program.)
    2019-12-05 19:51:47下载
    积分:1
  • BLDC、ACIM电机控制
    STM8单片机实现BLDC电机、ACIM电机控制,低成本解决方案。其中BLDC电机控制可实现HALL有传感器控制,BEMF无传感器控制。AICM电机控制策略MTPA控制。
    2022-05-15 15:42:38下载
    积分:1
  • BMS
    实现一个电池测试系统,用于对电池的充放电情况进行检测。(The realization of a battery test system for charging and discharging of the battery were detected.)
    2013-07-10 18:37:41下载
    积分:1
  • 深度学习 21天实战Caffe
    深度学习caffe框架学习,适合新手入门 下载后如果解压不成功,将后缀改为.7z再次解压即可(Deep learning caffe framework learning, suitable for beginners)
    2017-11-17 10:56:40下载
    积分:1
  • RTKLIB-rtklib_2.4.3
    说明:  通过GPS接收机,实现动态或静态状况下的精确定位。(realize the precise position)
    2019-04-03 15:33:47下载
    积分:1
  • 696518资源总数
  • 105895会员总数
  • 18今日下载