登录
首页 » c » 增强学习算法

增强学习算法

于 2022-08-10 发布 文件大小:1.45 kB
0 93
下载积分: 2 下载次数: 1

代码说明:

马尔卡夫决策过程理论定义了一个数学模型,可用于随机动态系统的最优决策过程。强化学习利用这个数学模型将一个现实中的问题变成一个数学问题。强化学习的故事1:找到最优价值强化学习就是:追求最大回报G追求最大回报G就是:找到最优的策略π∗。策略π∗告诉在状态s,应该执行什么行动a。最优策略可以由最优价值方法v∗(s)或者q∗(s,a)决定

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • ESeal
    ActiveX编程,实现了一个简单的电子印章功能。(ActiveX programming, to achieve a simple function of the electronic seal.)
    2009-01-03 11:26:18下载
    积分:1
  • StepinGl
    这是一个实现如何变换鼠标图像的例子,算是抛砖引玉吧(This is a realization of how to transform the image mouse example, it is something)
    2006-06-01 12:23:45下载
    积分:1
  • Study-of-Cross-Correlation
    互相关与自适应滤波测量流速的比较研究,,分别讨论了互相关法和自适应滤波时延估计法测量流速(Cross-correlation to compare and measure the flow rate of adaptive filtering, respectively, discussed the correlation method and adaptive filtering delay estimation method measuring the flow rate)
    2012-11-16 17:34:09下载
    积分:1
  • iCarousel
    ios iCarousel 多种滚轮效果,方便易用(ios iCarousel)
    2013-07-26 15:32:50下载
    积分:1
  • CodeBuilder
    说明:  代码生成器,C#源码,欢迎交流,带有详细功能,zip格式无密码(Code Builder)
    2011-04-02 08:49:57下载
    积分:1
  • allegro 六层板实例
    【实例简介】 使用Cadance Allegro手把手带大家一起绘制一块六层板。         设计的PCB板是一个网络相机,选这个设计的原因是涉及面比较广,高速的有DDR、MIPI等,其他RF、电源等等都有涉及,对大家全面了解不同类型的电路设计会比较有帮助。
    2021-09-07 00:30:56下载
    积分:1
  • opengl实现obj导入
    快速导入obj模型,OpenGL™ 是行业领域中最为广泛接纳的 2D/3D 图形 API,其自诞生至今已催生了各种计算机平台及设备上的数千优秀应用程序。OpenGL™ 是独立于视窗操作系统或其它操作系统的,亦是网络透明的。在包含CAD、内容创作、能源、娱乐、游戏开发、制造业、制药业及虚拟现实等行业领域中,OpenGL™ 帮助程序员实现在 PC、工作站 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2023-02-02 10:05:08下载
    积分:1
  • DX1
    this is s sample of DirectX
    2008-03-11 13:08:00下载
    积分:1
  • DS18B20LowPower
    说明:  stm32f103c8t6驱动DS18B20温湿度传感器程序源码(stm32f103c8t6,DS18B20)
    2019-06-30 08:30:23下载
    积分:1
  • Clinic Escape_swfdata
    游戏clinic espace反编译得到代码。(Game "Clinic Espace" decompile the code to get the code.)
    2017-12-17 14:15:34下载
    积分:1
  • 696516资源总数
  • 106442会员总数
  • 11今日下载