登录
首页 » python » 强化学习教程代码

强化学习教程代码

于 2022-03-15 发布 文件大小:247.06 kB
0 188
下载积分: 2 下载次数: 3

代码说明:

强化学习基本教程,包括A3C,DDPG等 有小车、机器臂等基本游戏的控制 强化学习是智能体(Agent)以“试错”的方式进行学习,通过与环境进行交互获得的奖赏指导行为,目标是使智能体获得最大的奖赏,强化学习不同于连接主义学习中的监督学习,主要表现在强化信号上,强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价(通常为标量信号),而不是告诉强化学习系统RLS(reinforcement learning system)如何去产生正确的动作。由于外部环境提供的信息很少,RLS必须靠自身的经历进行学习。通过这种方式,RLS在行动-评价的环境中获得知识,改进行动方案以适应环境。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • UNSW_NB15_RNN
    说明:  用UNSW数据集进行入侵检测,运用各种组合模型,精确度能达到90%以上,运用比较流行的神经网络模型分别进行了测试(Intrusion detection using UNSW dataset)
    2020-12-30 15:59:01下载
    积分:1
  • test1
    训练一个深度学习的循环神经网络,可实现获取公开数据集并进行训练,框架为Pytorch(Training a deep learning circular neural network can achieve the acquisition and training of open data sets, and the framework is Pytorch)
    2019-05-28 23:05:09下载
    积分:1
  • PCI_Code-Folder
    《集体智慧编程》这本书的源码,里面包含数据挖掘方面的一些算法,包括遗传算法,费舍尔算法,决策树等(" The collective wisdom of programming source code of this book, which contains the data mining aspects of algorithms, including genetic algorithms, Fisher algorithm, decision tree)
    2012-08-13 14:39:52下载
    积分:1
  • 直方图均衡化
    在VS2013+openCV平台运行,只要对图像进行均衡化,像素均衡,零度均衡,试图像像素分布均匀,使图像更加清晰,细节突出
    2022-03-21 23:48:19下载
    积分:1
  • 遗传算法 TSP
    说明:  遗传算法、禁忌搜索、模拟退火、蚁群算法 解决三十个城市的旅行商问题 人工智能课的一次作业,py写的,(Genetic algorithm, Tabu search, simulated annealing, Ant Colony algorithm to solve the traveling Salesman problem in 30 cities, an artificial intelligence class assignment, written by py,)
    2020-06-23 01:40:01下载
    积分:1
  • python自动化框架
    注意:请勿用于商业目的,仅供学习参考!!!python自动化测试开发框架
    2022-01-22 07:57:40下载
    积分:1
  • cuda-convnet-master
    基于GPU的 ,深度学习,Python代码(Based on GPU, deep learning, Python Code)
    2015-11-06 20:24:26下载
    积分:1
  • Faster-RCNN_TF-master (2)
    机器学习 关于 faster r-cnn 进行object detection(This is an experimental Tensorflow implementation of Faster RCNN - a convnet for object detection with a region proposal network. For details about R-CNN please refer to the paper Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks by Shaoqing Ren, Kaiming He, Ross Girshick, Jian Sun.)
    2020-10-12 22:57:32下载
    积分:1
  • CNN手写体识别报告
    人工智能课程作业,TensorFlow中使用CNN实现手写体数字识别,基于CNN实现手写体数字识别并对比MLP分析。文章对代码原理结构有较为详尽的分析和解释,结尾处附有程序完整代码,可在python中直接运行。(Artificial intelligence course assignments, TensorFlow uses CNN to realize handwritten numeral recognition, and CNN to realize handwritten numeral recognition and MLP analysis. This article has a more detailed analysis and explanation of the code principle and structure. At the end of the article, there is a complete program code, which can run directly in python.)
    2019-06-27 13:54:02下载
    积分:1
  • crawl
    利用python实现简单的爬虫功能,对网上的图片进行爬取,并用wxPython做了个设置界面(Use python reptiles simple function, the pictures online were crawling, and made a set with wxPython interface)
    2016-07-14 16:48:35下载
    积分:1
  • 696516资源总数
  • 106478会员总数
  • 6今日下载