登录
首页 » Python » 强化学习导论:Reinforcement learning - An introduction

强化学习导论:Reinforcement learning - An introduction

于 2021-07-16 发布
0 286
下载积分: 1 下载次数: 1

代码说明:

(最新)强化学习导论:Reinforcement learning - An introduction        2020英文版  作者:Richard S. Sutton and Andrew G. Barto       强化学习权威之作

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • Python内置函数及类型大全.pdf(共25页)
    Python内置函数及类型大全
    2020-02-19下载
    积分:1
  • 路径规划算法实现
    这个压缩包中的代码实现了机器人使用的一些常见的路径规划算法,包括基于搜索的算法和基于采样的算法。
    2021-05-07下载
    积分:1
  • 批处理文件
    【实例简介】配置批文件路径,根据匹配串匹配相关文件,进行复制保存
    2021-08-11 00:31:01下载
    积分:1
  • 电赛电磁炮python程序(sensor)
    2019电赛    电磁炮,河北省一等奖
    2019-09-17下载
    积分:1
  • python机器学习中文情感分析全套代码(料库+特征库++停用词+源码)
    python机器学习中文情感分析代码(语料库 特征库 停用词 源码),基于酒店评论语料库机器学习
    2020-06-06下载
    积分:1
  • CD编码嵌入双曲空间得到表征
    双曲嵌入作为一种捕获层次信息的方法被提出,可以将丰富的结构信息与现代机器学习分布式表达中所青睐的连续表示相融合。本实例将ICD编码嵌入双曲空间得到表征。下面是代码结构和结果分析: 1)数据预处理——数值向量化 将文本数据转换成数值向量,使用split函数将原本连接的文本数据分开,每个文本我们都会得到一个列表,构成词典。 2)主要程序代码 从上到下分别是建立整个网络模型的,构建网络参数的,和训练网络模型的。 3)参数的传入   训练的时候,这些参数的设置,batchsize是64,batchsize就是每轮训练的时候传入的是64个样本,dim 10表示维度是10,epoch 100表示训练了100轮,chechpoint-freq 是10 表示每过10个epoch保存一次模型。 4)训练过程 这个是训练过程中每一个epoch的loss值,MAP是评价指标
    2021-07-01 00:31:18下载
    积分:1
  • 人工智能深度强化学习算法DPPO控制机械臂
    【实例简介】利用深度强化学习算法对机械臂进行有效的控制,其中机械臂的优化目标为根据动态目标自由转动
    2021-05-29 00:31:21下载
    积分:1
  • 多word文档拼接
    【实例简介】多word文档拼接
    2021-06-22 00:31:14下载
    积分:1
  • python解析【爱奇艺vip会员电影网址】观看
    【实例简介】海量电影直接看,只需复制粘贴爱奇艺播放链接即可
    2021-06-11 00:31:34下载
    积分:1
  • 矩阵(math入门级示例)
    矩阵(math入门级示例)
    2020-03-03下载
    积分:1
  • 696518资源总数
  • 105877会员总数
  • 14今日下载