-
SSD: Single Shot MultiBox Object Detector, in PyTorch
SSD: Single Shot MultiBox Object Detector, in PyTorch
- 2020-02-02下载
- 积分:1
-
基于PyTorch的深度学习技术进步.pdf
基于PyTorch的深度学习技术进步.pdf
- 2019-12-28下载
- 积分:1
-
100个GH运算器详解(一)
【实例简介】
- 2021-08-06 00:30:59下载
- 积分:1
-
猜拳游戏(石头剪刀布.py)
# 石头 0 剪刀 1 布 2 import randombot = random.randint(0, 2)player = int(input("输入您的结果")) if (player == 1) and (bot == 2) or (player == 2) and (bot == 0) or (player == 0) and (bot == 1): print("玩家获胜") elif player == bot: print("你们打成平手") else: print("电脑获胜")
- 2020-11-30下载
- 积分:1
-
Python面试大全(245道面试题)
Python面试大全(245道面试题)
- 2020-12-09下载
- 积分:1
-
俄罗斯方块强化学习实验报告
一、俄罗斯方块DQN算法实验报告1. 网络结构图1 DQN网络结构2. 超参数 GAMMA = 0.99 # decay rate of past observations 设置增强学习更新公式中的累计折扣因子 OBSERVE = 500. # timesteps to observe before training 设置观察期的迭代次数 EXPLORE = 500. # frames over which to anneal epsilon 设置探索期的观察次数 FINAL_EPSILON = 0.002 # final value of epsilon 设置ε的最终最小值 INITIAL_EPSILON = 10.0 # starting value of epsilon 设置ε的初始值 REPLAY_MEMORY = 5900 # number of previous transitions to remember 设置replay memory的容量 BATCH = 32 # size of mini batch 设置每次网络参数更新世用的样本数目 K = 1 # only select an action every Kth frame, repeat prev for others,设置几帧图像进行一次动作, # K越大让控制台输出的速度变慢,游戏画面速度变快,机器人动作的速度变越迟缓。ACTIONS = 6 # number of valid actions 游戏动作数3.实验结果训练前期的self.score分数很低150左右,EPSILON=1.0,Q_MAX= 2.061341e-02:图2 EPSILON=1.0设置超参数EPSILON=0.05在1000步迭代之后:EPSILON固定在0.04999999999999416 Q_MAX = -1.163765e-01Self.score有明显的提升,但是之后无论训练多久都没有明显提升了。图3 EPSILON=0.05设置超参数EPSILON= 0.002在1001步迭代之后:EPSILON固定在0.000004 Q_MAX = 1.728995e 02Self.score可以轻松达到200以上。图4 EPSILON=0.000004设置超参数EPSILON= 0.000001在1001步迭代之后:EPSILON固定在-0.001998997999987482 Q_MAX = 1.899879e 03Self.score可以轻松达到200以上。图5 EPSILON=-0.002 【核心代码】用DQN来玩俄罗斯方块 tetrix_DQN ├── Wrapped Game Code│ └── tetris_fun.py├── deep_q_network.py├── logs_tetris│ ├── hidden.txt│ └── readout.txt└── saved_networks ├── tetris-dqn-10000.data-00000-of-00001 ├── tetris-dqn-10000.index ├── tetris-dqn-10000.meta └── tetris-dqn-316600003 directories, 8 files
- 2020-12-01下载
- 积分:1
-
深度学习之三:深度强化学习(DQN-Deep Q Network)之应用-Flappy Bird
目录1.达到的目的2.思路 2.1.强化学习(RL Reinforcement Learing) 2.2.深度学习(卷积神经网络CNN)3.踩过的坑4.代码实现(python3.5)5.运行结果与分析
- 2019-08-09下载
- 积分:1
-
pycharm详细教程.pdf(入门级)
共计21页
- 2020-12-09下载
- 积分:1
-
DCGAN算法图像生成
使用GAN算法生成图像
- 2020-12-02下载
- 积分:1
-
harris和sift特征提取匹配(python)
计算机视觉,局部图像描述子python实现harris角点检测,特征匹配,sift特征检测和匹配,可以直接运行,内附VLFeat工具包sift,立体图像的特征提取和匹配是机器人视觉定位的核心技术,立体图像的特征点的匹配精度直接影响视觉导航定位的精度。
- 2019-04-03下载
- 积分:1