登录
首页 » Python » Python实例

Python实例

于 2021-05-07 发布
0 243
下载积分: 1 下载次数: 1

代码说明:

关于Python的小例子,适合Python初学者

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • python实验课做的一些小程序
    bp、爬虫、cnn 实验
    2020-12-12下载
    积分:1
  • python书籍:A Primer on Scientfic Programming with Python, Third Edition
    【实例简介】
    2021-08-09 00:31:01下载
    积分:1
  • python进制之间互相转换
    进制之间互相转换(支持、八进制、二进制、十六进制、十进制之间转换)
    2021-08-01 00:31:04下载
    积分:1
  • python udp聊天示例源码
    python udp聊天示例源码
    2018-08-21下载
    积分:1
  • 玛丽冒险(项目源码下载)-Python项目开发案例集锦04.zip
    玛丽冒险(项目源码下载)-Python项目开发案例集锦04.zip
    2019-09-22下载
    积分:1
  • 路径规划A*算法python实现
    基础路径规划A*算法python实现
    2021-05-06下载
    积分:1
  • 编写程序,输入两个分别包含若干整数的列表LA、LB.py
    【实例简介】编写程序,输入两个分别包含若干整数的列表LA、LB.py 编写程序,输入两个分别包含若干整数的列表LA、LB,输出一个字典,要求用LA中的元素作为键,用LB中的元素作为值,并且最终字典中的元素数量取决于LA和LB中元素较少的列表的数量;
    2022-01-10 00:31:45下载
    积分:1
  • 网络爬虫(pachong_anjuke.py)
    :爬取网站数据,基于 selenium.webdriver
    2021-05-06下载
    积分:1
  • python 数据结构与分析
    【实例简介】python 数据结构与分析
    2021-12-21 00:31:10下载
    积分:1
  • 俄罗斯方块强化学习实验报告
    一、俄罗斯方块DQN算法实验报告1. 网络结构图1 DQN网络结构2. 超参数 GAMMA = 0.99  # decay rate of past observations 设置增强学习更新公式中的累计折扣因子 OBSERVE = 500.  # timesteps to observe before training 设置观察期的迭代次数 EXPLORE = 500.  # frames over which to anneal epsilon 设置探索期的观察次数 FINAL_EPSILON = 0.002  # final value of epsilon 设置ε的最终最小值 INITIAL_EPSILON = 10.0  # starting value of epsilon 设置ε的初始值 REPLAY_MEMORY = 5900  # number of previous transitions to remember 设置replay memory的容量 BATCH = 32  # size of mini batch 设置每次网络参数更新世用的样本数目 K = 1  # only select an action every Kth frame, repeat prev for others,设置几帧图像进行一次动作, # K越大让控制台输出的速度变慢,游戏画面速度变快,机器人动作的速度变越迟缓。ACTIONS = 6  # number of valid actions 游戏动作数3.实验结果训练前期的self.score分数很低150左右,EPSILON=1.0,Q_MAX= 2.061341e-02:图2 EPSILON=1.0设置超参数EPSILON=0.05在1000步迭代之后:EPSILON固定在0.04999999999999416  Q_MAX = -1.163765e-01Self.score有明显的提升,但是之后无论训练多久都没有明显提升了。图3 EPSILON=0.05设置超参数EPSILON= 0.002在1001步迭代之后:EPSILON固定在0.000004 Q_MAX = 1.728995e 02Self.score可以轻松达到200以上。图4 EPSILON=0.000004设置超参数EPSILON= 0.000001在1001步迭代之后:EPSILON固定在-0.001998997999987482  Q_MAX = 1.899879e 03Self.score可以轻松达到200以上。图5 EPSILON=-0.002 【核心代码】用DQN来玩俄罗斯方块 tetrix_DQN ├── Wrapped Game Code│   └── tetris_fun.py├── deep_q_network.py├── logs_tetris│   ├── hidden.txt│   └── readout.txt└── saved_networks    ├── tetris-dqn-10000.data-00000-of-00001    ├── tetris-dqn-10000.index    ├── tetris-dqn-10000.meta    └── tetris-dqn-316600003 directories, 8 files
    2020-12-01下载
    积分:1
  • 696516资源总数
  • 106442会员总数
  • 11今日下载