-
iris 数据集
【实例简介】Iris数据集是常用的分类实验数据集,由Fisher, 1936收集整理。Iris也称鸢尾花卉数据集,是一类多重变量分析的数据集。数据集包含150个数据样本,分为3类,每类50个数据,每个数据包含4个属性。可通过花萼长度,花萼宽度,花瓣长度,花瓣宽度4个属性预测鸢尾花卉属于(Setosa,Versicolour,Virginica)三个种类中的哪一类。
- 2021-11-10 00:36:05下载
- 积分:1
-
俄罗斯方块强化学习实验报告
一、俄罗斯方块DQN算法实验报告1. 网络结构图1 DQN网络结构2. 超参数 GAMMA = 0.99 # decay rate of past observations 设置增强学习更新公式中的累计折扣因子 OBSERVE = 500. # timesteps to observe before training 设置观察期的迭代次数 EXPLORE = 500. # frames over which to anneal epsilon 设置探索期的观察次数 FINAL_EPSILON = 0.002 # final value of epsilon 设置ε的最终最小值 INITIAL_EPSILON = 10.0 # starting value of epsilon 设置ε的初始值 REPLAY_MEMORY = 5900 # number of previous transitions to remember 设置replay memory的容量 BATCH = 32 # size of mini batch 设置每次网络参数更新世用的样本数目 K = 1 # only select an action every Kth frame, repeat prev for others,设置几帧图像进行一次动作, # K越大让控制台输出的速度变慢,游戏画面速度变快,机器人动作的速度变越迟缓。ACTIONS = 6 # number of valid actions 游戏动作数3.实验结果训练前期的self.score分数很低150左右,EPSILON=1.0,Q_MAX= 2.061341e-02:图2 EPSILON=1.0设置超参数EPSILON=0.05在1000步迭代之后:EPSILON固定在0.04999999999999416 Q_MAX = -1.163765e-01Self.score有明显的提升,但是之后无论训练多久都没有明显提升了。图3 EPSILON=0.05设置超参数EPSILON= 0.002在1001步迭代之后:EPSILON固定在0.000004 Q_MAX = 1.728995e 02Self.score可以轻松达到200以上。图4 EPSILON=0.000004设置超参数EPSILON= 0.000001在1001步迭代之后:EPSILON固定在-0.001998997999987482 Q_MAX = 1.899879e 03Self.score可以轻松达到200以上。图5 EPSILON=-0.002 【核心代码】用DQN来玩俄罗斯方块 tetrix_DQN ├── Wrapped Game Code│ └── tetris_fun.py├── deep_q_network.py├── logs_tetris│ ├── hidden.txt│ └── readout.txt└── saved_networks ├── tetris-dqn-10000.data-00000-of-00001 ├── tetris-dqn-10000.index ├── tetris-dqn-10000.meta └── tetris-dqn-316600003 directories, 8 files
- 2020-12-01下载
- 积分:1
-
arcpy生成raster外接矩形shp文件
利用python脚本,调用arcpy工具,提取卫星影像外接矩形适量数据。
- 2021-05-06下载
- 积分:1
-
python wifi 破解(基于pywifi)
用字典破解wifi 密码 利用 py_wifi 加上字典跑wifi密码
- 2020-12-09下载
- 积分:1
-
网易云音乐爬虫实例(亲测通过)
用于网易云音乐中的音乐爬取并下载,而且可爬取到云热评
- 2020-12-12下载
- 积分:1
-
WIn10+Anaconda环境下安装PyTorch(避坑指南)
WIn10+Anaconda环境下安装PyTorch(避坑指南)
- 2021-05-06下载
- 积分:1
-
模拟决赛现场最终成绩计算.py
【实例简介】模拟决赛现场最终成绩计算.py
编写函数,模拟决赛现场最终成绩计算过程。首先输入大于2的整数作为评委人数,然后依次输入每个评委的打分,要求每个评委打的分数都介于0~100。输入完所有评委打分之后,去掉一个最高分,去掉一个最低分,剩余分数的平均分即为该选手的最终评分。
- 2022-01-10 00:31:45下载
- 积分:1
-
python websocket聊天室 示例源码(Flask-socketio)
实时消息更新,实时用户上线显示快捷注册快捷登陆表情支持
- 2019-02-28下载
- 积分:1
-
联邦学习框架代码
联邦学习的基本框架
- 2021-05-07下载
- 积分:1
-
车牌识别
【实例简介】
- 2021-07-12 00:31:49下载
- 积分:1