-
俄罗斯方块强化学习实验报告
一、俄罗斯方块DQN算法实验报告1. 网络结构图1 DQN网络结构2. 超参数 GAMMA = 0.99 # decay rate of past observations 设置增强学习更新公式中的累计折扣因子 OBSERVE = 500. # timesteps to observe before training 设置观察期的迭代次数 EXPLORE = 500. # frames over which to anneal epsilon 设置探索期的观察次数 FINAL_EPSILON = 0.002 # final value of epsilon 设置ε的最终最小值 INITIAL_EPSILON = 10.0 # starting value of epsilon 设置ε的初始值 REPLAY_MEMORY = 5900 # number of previous transitions to remember 设置replay memory的容量 BATCH = 32 # size of mini batch 设置每次网络参数更新世用的样本数目 K = 1 # only select an action every Kth frame, repeat prev for others,设置几帧图像进行一次动作, # K越大让控制台输出的速度变慢,游戏画面速度变快,机器人动作的速度变越迟缓。ACTIONS = 6 # number of valid actions 游戏动作数3.实验结果训练前期的self.score分数很低150左右,EPSILON=1.0,Q_MAX= 2.061341e-02:图2 EPSILON=1.0设置超参数EPSILON=0.05在1000步迭代之后:EPSILON固定在0.04999999999999416 Q_MAX = -1.163765e-01Self.score有明显的提升,但是之后无论训练多久都没有明显提升了。图3 EPSILON=0.05设置超参数EPSILON= 0.002在1001步迭代之后:EPSILON固定在0.000004 Q_MAX = 1.728995e 02Self.score可以轻松达到200以上。图4 EPSILON=0.000004设置超参数EPSILON= 0.000001在1001步迭代之后:EPSILON固定在-0.001998997999987482 Q_MAX = 1.899879e 03Self.score可以轻松达到200以上。图5 EPSILON=-0.002 【核心代码】用DQN来玩俄罗斯方块 tetrix_DQN ├── Wrapped Game Code│ └── tetris_fun.py├── deep_q_network.py├── logs_tetris│ ├── hidden.txt│ └── readout.txt└── saved_networks ├── tetris-dqn-10000.data-00000-of-00001 ├── tetris-dqn-10000.index ├── tetris-dqn-10000.meta └── tetris-dqn-316600003 directories, 8 files
- 2020-12-01下载
- 积分:1
-
python图书管理系统课程设计(含数据库结构文档)
图书管理系统 使用说明 功能演示: 下载整个程序包,确保系统有python3环境,打开cmd,输入命令(替换成本机的工程目录地址): python F:ook_management_sysook_management_sys.py runserver 浏览器输入 http://127.0.0.1:5000/ 进入系统 系统分两类用户:普通读者用户,管理员用户。 普通读者用户可以查看图书信息和查看借阅记录,在登录页顶端导航栏切换功能,不用输入用户名、密码。 管理员用户可使用一切功能,账号、密码登陆后,进行日常业务操作。 测试数据: 图书信息书名可填写“学习”“机器”,类别可填写“计算机”等;学生借阅卡可填写:16000001,16000002,16000003(该卡无借阅记录);
- 2020-12-12下载
- 积分:1
-
python 数据结构与分析
【实例简介】python 数据结构与分析
- 2021-12-21 00:31:10下载
- 积分:1
-
《生成对抗网络入门指南》随书源码
《生成对抗网络入门指南》随书源码
- 2019-12-13下载
- 积分:1
-
Python实现EXCEL图标自动生成
OpenPyXL支持使用工作表单元格中的数据创建条形图,折线图,散点图和饼图。要制作图表,您需要执行以下操作:1. Reference从矩形选择的单元格创建对象。2. Series通过传入对象来创建Reference对象。3. 创建一个Chart对象。4. 将Series对象附加到Chart对象。5. 将Chart对象添加到Worksheet对象,可选择指定图表左上角应定位的单元格。
- 2020-04-23下载
- 积分:1
-
Python编程快速上手—让繁琐工作自动化(源码)
【实例简介】
- 2021-05-18 10:33:09下载
- 积分:1
-
python绘制一个图形示例源码(tkinter)
python绘制一个图形示例源码(tkinter)
- 2018-09-18下载
- 积分:1
-
textCNN文本分类
textCNN文本分类
- 2021-05-06下载
- 积分:1
-
多种风机功率曲线的过滤方法
python实现多种风机数据清洗,绘制功率曲线,包括kmeans,DBSCAN,KernelDensity等方法
- 2021-05-06下载
- 积分:1
-
Python爬虫开源项目代码
Python爬虫开源项目代码
- 2020-11-28下载
- 积分:1