登录
首页 » python » 强化学习鸳鸯问题

强化学习鸳鸯问题

于 2022-02-12 发布 文件大小:2.01 kB
0 42
下载积分: 2 下载次数: 1

代码说明:

 马尔科夫决策过程(Markov Decision Process)是强化学习(reinforcement learning)最基本的模型框架。它对序列化的决策过程做了很多限制。比如状态StSt和动作atat只有有限个、 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • LSTM
    说明:  基于LSTM的时序预测,训练1000次后对未来价格进行预测(Time series prediction based on LSTM)
    2020-08-30 16:08:10下载
    积分:1
  • imfill
    点云插值,离散点云插值,孔洞填充,使用python语言(Point cloud interpolation, discrete point cloud interpolation, hole filling, using Python language)
    2020-07-02 04:00:01下载
    积分:1
  • 下雪
    说明:  关于下雪的代码是用python实现的,用于学习交流的(The code about snow is implemented in Python for learning and communication)
    2019-11-11 11:45:40下载
    积分:1
  • balance-demostration
    nao机器人的平衡程序,这是nao机器人比赛用的程序,可以人机互动和演示。(Nao robot balancing process, which is the NAO robot contest with the program, you can interact and demonstration.)
    2015-06-01 22:04:47下载
    积分:1
  • 模拟登陆Python
    自己捣鼓的模拟登陆的代码 参考了网上的很多相关代码
    2022-03-22 01:27:58下载
    积分:1
  • python ntpserver
    基于ntplib,socket和thread的ntpserver,可用于时间同步,并附带一个ntplclient
    2022-05-17 10:04:56下载
    积分:1
  • ABAQUS_Cohesive element_test
    abaqus软件有限元cohesive单元模拟裂纹扩展 断裂与疲劳(Simulation of crack propagation in cohesive cell)
    2020-09-22 21:37:50下载
    积分:1
  • manage.py
    dgango框架搭建的配置文件参考,源于edX开源项目代码(dgango profile reference frame structures, from edX open source project code)
    2013-12-09 16:28:18下载
    积分:1
  • lstm-gru-pytorch-master
    说明:  使用python和pytorch实现LSTM和GRU网络,并用MNIST数据集进行训练学习(Use Python and python to implement LSTM and Gru network, and use MNIST data set for training and learning)
    2020-03-07 21:47:57下载
    积分:1
  • tcpserver
    说明:  Python实现的TCP server,已成功应用,可直接部署在服务器上(The TCP server implemented by Python has been successfully applied and can be directly deployed on the server)
    2019-11-29 09:14:04下载
    积分:1
  • 696522资源总数
  • 104027会员总数
  • 45今日下载