登录
首页 » Python » (强化学习入门)David Silver

(强化学习入门)David Silver

于 2019-06-20 发布 文件大小:13933KB
0 102
下载积分: 1 下载次数: 4

代码说明:

  深度学习的中文版本,里面详细介绍了深度学习的各种算法,其中还有一些用到的基础内容,例如矩阵和向量的范数(Chinese version of the depth of learning, which detailed the depth of learning algorithms, some of which used the basics, such as vector and matrix norm)

文件列表:

David Silver\[10]games.pdf, 3103889 , 2018-05-25
David Silver\[1] intro_RL.pdf, 2997953 , 2018-03-25
David Silver\[2] MDP.pdf, 835315 , 2018-03-25
David Silver\[3] DP.pdf, 823976 , 2018-03-25
David Silver\[4] MC-TD.pdf, 1455589 , 2018-03-25
David Silver\[5] control.pdf, 1494703 , 2018-03-25
David Silver\[6]Value Function Approximation.pdf, 1996806 , 2018-05-25
David Silver\[7]Policy Gradient.pdf, 1874832 , 2018-04-28
David Silver\[8] Integrating Learning and Planning.pdf, 2176944 , 2018-05-25
David Silver\[9]Exploration and Exploitation.pdf, 1339671 , 2018-05-25
David Silver, 0 , 2018-05-25

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 冒泡排序的MPIC
    应用背景读取一个文本文件包含数字(小于2E8),它存储在一个动态数组的冒泡排序法,并打印出另一个文本文件。在终端中返回每个进程的运行时。如果该参数没有指定,默认为一个叫做“Sal txt文件。”(必须保存在当前目录),如果参数定义的文件进入参数与数组排序。关键技术泡沫排序,有时也称为“下沉排序”,是一个简单的排序算法,通过列表中的重复步骤来进行排序,比较每一对相邻的项目,如果它们是错误的顺序。通过列表的传递,直到不需要进行任何交换,这说明列表是排序的。这是一个比较排序的算法,它被命名为较小的元素“泡沫”到列表的顶部。虽然算法简单,但对于大多数问题来说,它是太慢和不切实际的,即使在插入排序。[ 1 ]它可以是实际的,如果输入通常是按排序顺序,但可能会偶尔有一些顺序元素的位置近。
    2023-01-14 11:15:03下载
    积分:1
  • openmp-opecg-2009-part-03
    opemmp c-c++ document
    2010-01-05 07:25:17下载
    积分:1
  • mapreduce下矩阵相乘——内积方法
    左矩阵A是m×s,右矩阵B是s×n,结果矩阵C是m×n。
    2023-01-06 10:40:03下载
    积分:1
  • 罚函数
    说明:  利用罚函数计算min X1^2+X2^2 s.t. 2X1-X2≤7 X1^2+3X2^2=2(Penalty function calculation)
    2019-05-26 12:17:56下载
    积分:1
  • cuda语言实现向量相加
    本程序是cuda语言实现向量相加的例子,通过这个例子可以学习cuda的基本语法格式,
    2023-07-27 23:25:04下载
    积分:1
  • lu
    说明:  这是用并行程序语言MPI做的关于矩阵LU分解的程序,程序中很好的实现了分解过程的并行性。(This is used MPI parallel programming language to do LU decomposition on the matrix of the procedures, procedures to achieve a good decomposition process parallelism.)
    2008-12-05 13:56:57下载
    积分:1
  • ad9850
    内含串行与并行模式程序。有读函数,写函数,复位说明 与测试程序主函数(With serial and parallel mode program. Read write function, function, reset and test program main function)
    2013-08-31 13:08:23下载
    积分:1
  • AMD-APP-Docs
    AMD显卡编程的一些官方参考资料,与nVidia的cuda编程相似(reference materials on AMD APP programming)
    2012-06-13 13:06:21下载
    积分:1
  • 示波器代码
    示波器的源代码,效果不错的,dlo1w1dsc hhjhsdf sfdssd  fsdhsdfhsdj eewrew erewrewr dsfefh  dsdewh
    2022-07-07 20:07:57下载
    积分:1
  • 数字时钟
    它是一个基于8051的频率计数器,可以用作学习工具。很有用的开始。
    2023-08-27 17:20:03下载
    积分:1
  • 696524资源总数
  • 103886会员总数
  • 81今日下载