登录
首页 » python » 强化学习教程代码

强化学习教程代码

于 2022-03-15 发布 文件大小:247.06 kB
0 157
下载积分: 2 下载次数: 3

代码说明:

强化学习基本教程,包括A3C,DDPG等 有小车、机器臂等基本游戏的控制 强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • deep_learing_pytorch
    说明:  pytorch架构下用CNN架构识别mnist,其中含有多种优化器(Recognition of MNIST under pytorch architecture)
    2019-12-04 14:54:26下载
    积分:1
  • 将文件分块进行存储和传输
    该资源的功能是通过给定的文件路径来获得相应的文件和文件夹,并且将给定的数据进行平均等分的写入到相应的文件和文件夹中,然后进行文件和文件夹的数据之间的传输,并且还能动态的监测出失效的节点
    2022-03-18 16:12:14下载
    积分:1
  • 用CNN做电能质量扰动分类
    说明:  用CNN对电能质量扰动进行分类,可以直接使用,数据都在里面,仅供参考(Use CNN to classify power quality disturbances, which can be used directly, and the data are in it for reference only)
    2020-07-02 02:40:02下载
    积分:1
  • non_local
    说明:  自己用python复现的NL-mean去噪,备注比较详细,便于理解原理; 之后会尝试复现更多图像领域的经典论文(The NL-mean reproduced by Python is used to denoise the noise. The notes are detailed and easy to understand the principle. We will try to reproduce more classical papers in the field of image.)
    2020-06-21 00:40:02下载
    积分:1
  • hucai
    说明:  水表图像识别 图像预处理 哈哈就不懂四周(Water Meter Image Recognition)
    2019-06-19 18:27:49下载
    积分:1
  • pyDOE-0.3.8
    说明:  pydoe包是python关于实验设计采样的工具包,其中包含了拉丁超立方等方法。(pydoe: The experimental design package for python)
    2020-10-12 23:37:32下载
    积分:1
  • 手写体识别
    基于卷积神经网络用于离线手写体识别,适用于初学者,非常详细的代码注释,很容易上手
    2023-07-20 08:05:03下载
    积分:1
  • Python
    使用python语言编程实现生成voronoi的二维图像(Using python programming language to generate two-dimensional images of Voronoi)
    2017-09-22 10:10:48下载
    积分:1
  • 局部搜索图着色
    说明:  图着色局部搜索,图着色问题(Graph Coloring Problem, GCP) 又称着色问题,是最著名的NP-完全问题之一。道路着色问题(Road Coloring Problem)是图论中最著名的猜想之一。 数学定义:给定一个无向图G=(V, E),其中V为顶点集合,E为边集合,图着色问题即为将V分为K个颜色组,每个组形成一个独立集,即其中没有相邻的顶点。其优化版本是希望获得最小的K值。(Graph Coloring Problem (Graph Coloring Problem, GCP), also known as coloring problem, is one of the most famous NP-complete problems. The Road Coloring Problem is one of the most famous conjectures in graph theory. Mathematical definition: Given an undirected graph G=(V, E), where V is the set of vertices and E is the set of edges, the graph coloring problem is to divide V into K color groups, and each group forms an independent set. That is, there are no adjacent vertices. The optimized version is to get the smallest K value.)
    2021-04-01 16:49:10下载
    积分:1
  • 罗汉塔
    说明:  可解释出罗汉塔游戏秘籍,层数不定。理解简单,操作也只需要输入层数。依照步骤即可完成游戏。(It can explain the secret book of Luohanta game, the number of layers is uncertain.)
    2020-06-20 05:20:02下载
    积分:1
  • 696518资源总数
  • 105722会员总数
  • 0今日下载