登录
首页 » Python » 俄罗斯方块强化学习实验报告

俄罗斯方块强化学习实验报告

于 2020-12-01 发布
0 329
下载积分: 1 下载次数: 3

代码说明:

一、俄罗斯方块DQN算法实验报告1. 网络结构图1 DQN网络结构2. 超参数 GAMMA = 0.99  # decay rate of past observations 设置增强学习更新公式中的累计折扣因子 OBSERVE = 500.  # timesteps to observe before training 设置观察期的迭代次数 EXPLORE = 500.  # frames over which to anneal epsilon 设置探索期的观察次数 FINAL_EPSILON = 0.002  # final value of epsilon 设置ε的最终最小值 INITIAL_EPSILON = 10.0  # starting value of epsilon 设置ε的初始值 REPLAY_MEMORY = 5900  # number of previous transitions to remember 设置replay memory的容量 BATCH = 32  # size of mini batch 设置每次网络参数更新世用的样本数目 K = 1  # only select an action every Kth frame, repeat prev for others,设置几帧图像进行一次动作, # K越大让控制台输出的速度变慢,游戏画面速度变快,机器人动作的速度变越迟缓。ACTIONS = 6  # number of valid actions 游戏动作数3.实验结果训练前期的self.score分数很低150左右,EPSILON=1.0,Q_MAX= 2.061341e-02:图2 EPSILON=1.0设置超参数EPSILON=0.05在1000步迭代之后:EPSILON固定在0.04999999999999416  Q_MAX = -1.163765e-01Self.score有明显的提升,但是之后无论训练多久都没有明显提升了。图3 EPSILON=0.05设置超参数EPSILON= 0.002在1001步迭代之后:EPSILON固定在0.000004 Q_MAX = 1.728995e 02Self.score可以轻松达到200以上。图4 EPSILON=0.000004设置超参数EPSILON= 0.000001在1001步迭代之后:EPSILON固定在-0.001998997999987482  Q_MAX = 1.899879e 03Self.score可以轻松达到200以上。图5 EPSILON=-0.002 【核心代码】用DQN来玩俄罗斯方块 tetrix_DQN ├── Wrapped Game Code│   └── tetris_fun.py├── deep_q_network.py├── logs_tetris│   ├── hidden.txt│   └── readout.txt└── saved_networks    ├── tetris-dqn-10000.data-00000-of-00001    ├── tetris-dqn-10000.index    ├── tetris-dqn-10000.meta    └── tetris-dqn-316600003 directories, 8 files

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 100个GH运算器详解(一)
    【实例简介】
    2021-08-06 00:30:59下载
    积分:1
  • 卷积神经网络在医学图像分割中的研究进展.pdf
    卷积神经网络在医学图像分割的研究综述
    2020-11-29下载
    积分:1
  • A3C强化学习PYTHON代码
    A3C强化学习PYTHON代码
    2021-05-07下载
    积分:1
  • python 监督分类
    对光学遥感影像进行分类,对特征进行标记,使用SVM、随机森林进行分类预测精度
    2021-05-06下载
    积分:1
  • 哆啦A梦画像(于turtle)
    【实例简介】哆啦A梦画像
    2021-08-01 00:31:05下载
    积分:1
  • 联邦学习实战代码
    联邦学习实战代码
    2021-05-07下载
    积分:1
  • 中科大DIA第四次作业匹配几何校验(源码+实验报告+参考资料)
    【实例简介】 1.给定一对图像,利用提取好的SIFT特征文件,根据距离阈值准则(跨图像的局部SIFT特征距离小于0.4),得到图像间的初始局部特征匹配关系 2.基于上述初步匹配结果,实现spatial coding方法,进行匹配校验,确定几何不一致的匹配 3.将几何一致的匹配和不一致的匹配在图像上画出来,分别用蓝色和红色进行区分
    2021-10-10 00:31:07下载
    积分:1
  • 信息轰炸源码
    【实例简介】微信、QQ等聊天软件信息轰炸,在输入间隔时间、内容、数量后,将鼠标光标定位到聊天窗口输入框,发送模式调整为回车键发送,即可自动发送
    2021-11-16 00:32:53下载
    积分:1
  • 《PyQt5快速开发与实战》随书源码
    使用的是最新版本的PyQt5.9,详细讲解了PyQt5的各个知识点,包含从入门到实战的所有例子。本书共包含11个章节,这些章节基本包含了笔者在使用PyQt中遇到的绝大多数技术以及一些简单的应用。本书虽然有11个章节,但是有些章节是具有独立性的,读者可以针对自己的实际情况选择性阅读。本书第一章介绍了PyQt的入门知识,讲述了PyQt的安装配置以及Eric6这个IDE的简单使用方法。对于对PyQt已经有一定基础的朋友可以略去这一章。本书第二章简单介绍了Python的基本语法,本章针对一些没有接触过python的读者,对于Python已经有一些基础的朋友可以略去这一章。本书第三章介绍Qt Designer的使用方法,Qt Designer是一个PyQt的可视化界面编辑程序,他的作用是帮助我们快速开发出界面文件,我们可以通过其他方式把界面文件转化成python代码文件。对于不懂太多PyQt知识的读者来说,本章可以让你快速入门,同时,本章也是让自己的PyQt技术快速进步的最重要的章节。本书第四章介绍了PyQt的基本控件的使用方法,如果读者时间并不充裕,只对部分控件感兴趣,可以选取相应的小节进行阅读。本书第五章介绍了PyQt的高级控件的使用方法,如果读者对PyQt的表格、树、多文本页面、数据库、多线程等等感兴趣,可以在这一章中选择相应的小节阅读。本书第六章重新介绍了PyQt的布局管理的使用(之前在第3章通过Qt Designer的使用方法中已经介绍,第3章是通过Qt Designer这个代码生成器进行介绍,这里通过手工敲打代码的方法介绍)。由于布局管理非常重要,值得我们以一个新的章节介绍,如果读者对纯代码实现布局管理器感兴趣可以参考这一章,如果对代码生成器Qt Designer的布局管理器感兴趣也可以忽略这个章节。实际上两种方法并没有本质的区别。本书第七章介绍了PyQt信号与槽的应用,信号与槽是PyQt的核心,想要掌握PyQt的高级玩法的朋友可以仔细阅读这个章节。本书第八章介绍了PyQt的图形特效,如果读者对PyQt绘图,背景着色等感兴趣,可以阅读这个章节。本书第九章介绍了PyQt的扩展应用,如果你想知道如何把Python的一些非常流行的模块如pyinstaller、pandas、matplotlib、pyqtgraph、plotly等与PyQt结合,可以从这一章节中选择性的阅读。本书第十章通过几个例子介绍PyQt的实战应用,想要简单了解一些简单的程序是如何开发的朋友可以选择性的阅读这个章节。本书第十一章介绍PyQt在金融领域中的应用,是本书的另一个作者孙洋在金融公司工作过程中积累的一些实战性较高的案例,向读者展示PyQt如何应用到投资研究系统、量化投资、以及金融工具开发,读者可以根据自己的需求选择性阅读。
    2019-07-15下载
    积分:1
  • 于深度学习字符型图片数字验证码识别完整过程及Python实现(深度学习学习、实现数字、字符模型训练、详细介绍附源码)
    基于深度学习字符型图片数字验证码识别完整过程及Python实现(深度学习学习、实现数字、字符模型训练、详细介绍附源码)
    2019-06-19下载
    积分:1
  • 696516资源总数
  • 106658会员总数
  • 16今日下载