登录
首页 » c » 增强学习算法

增强学习算法

于 2022-08-10 发布 文件大小:1.45 kB
0 75
下载积分: 2 下载次数: 1

代码说明:

马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。强化学习的故事1:找到最优价值强化学习就是:追求最大回报G追求最大回报G就是:找到最优的策略π∗。策略π∗告诉在状态s,应该执行什么行动a。最优策略可以由最优价值方法v∗(s)或者q∗(s,a)决定

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • stdlib
    C库基本函数的实现过程,都是标准C的函数,写的很好的(C library implementation process of the basic functions are standard C functions, written in good)
    2010-09-28 01:26:28下载
    积分:1
  • WayGrowLite_v1.1
    说明:  mt4 ea, trade good, fast connection
    2019-02-06 03:16:08下载
    积分:1
  • 本程序是用c语言编写的运动会分数统计的程序,欢迎下载哈
    本程序是用c语言编写的运动会分数统计的程序,欢迎下载哈-this procedure is used to prepare the language c Games Score statistical procedures, Kazakhstan welcomes Download
    2023-08-27 04:20:03下载
    积分:1
  • 摄像头滤波
    第十四届智能车华北赛一等奖滤波程序开源。(Open source filtering program for the first prize of the 14th North China Smart Vehicle Race.)
    2020-06-18 09:20:02下载
    积分:1
  • msvbvm50
    msvbvm50.rar 动行库文件(msvbvm50.rar dynamic library file line)
    2009-01-17 09:40:43下载
    积分:1
  • hotop100OA1.1_51aspx
    专业的办公oa代码下载 c#语言编写 三层结构(Oa office professional code download c# Three-tier structure of language)
    2007-10-16 14:33:09下载
    积分:1
  • waterinteraction
    Water interanction in openGL
    2019-05-14 01:36:29下载
    积分:1
  • pwm测试模块 dsp
    【实例简介】pwm测试模块 dsp ti芯片 测试用例 直接可以使用
    2021-12-11 00:41:45下载
    积分:1
  • 用VC编写文件加密程序的源代码
    用VC编写文件加密程序加密,欢迎大家下载研究开发 只是简单的文件加密,真正的加密软件还要做很多事情。
    2022-11-19 19:45:04下载
    积分:1
  • S3C2410 led点灯裸机程序
    有11个程序,简单的LED点灯裸机程序
    2023-01-12 07:35:04下载
    积分:1
  • 696518资源总数
  • 105562会员总数
  • 1今日下载