-
崇志宏:强化学习和深度强化学习
深度学习在强化学习方面的应用所产生的深度强化学习取得快速发展。如何解释深度强化学习优势产生的原因是理解技术的基本方法。强化学习的问题ntel ab数据&智能实验室Agentstate rewardS,||R+=PS=1=8:8:1anR,+1, Environment5o,A0,B1,S1,41,,S2,A2,R3东南大学数据与智能实验室(D& nte lab)强化学习算法的基本范式ntel ab数据&智能实验室Generalized Policy Iteration1. Policy Iteration2. Value iterationevaluationTTU,丌率丌~ greedy(Vdyugreimprovement1. Policy Evaluation博弈2. Policy Improvement1.策略评价逼近策略价值2.策略提高远离策略价值Elements of rlntel ab数据&智能实验室o Policy Valuation Oriented MethodsModel-based or free estimationExp ion or Exploit0 nl ine or0千f|ineExpans ion and Backup Operation(q*)maxnax东南大学数据与智能实验室(D& Inte lab)Position of rlntel ab数据&智能实验室Long short TermPixeICNNPixeIRNNMemory(LSTM)ConvolutionNetworks withFully ConnectedNeural NetworkAutoregressiveNetworkMemoryNetwork(CNN)(FCN)StochasticGradientSecond OrderEarth Mover DistanceDescent (SGD)Algorithms(EMD)NetworksyRt+k+1 St=s, At=ak=0
- 2020-12-09下载
- 积分:1
-
qml 资料&练习&项目
这是我收集的qml程序,从最简单的一些qml效果,到扫雷、算数,还有美图秀秀、音乐播放器、文件管理器等等等...学完这些应该就可以比较熟练掌握Qml了吧,很遗憾我现在用不上了,在电脑里也浪费,放上来希望对有用的人有用吧。(都是用真金白银搞回来的,虽然收5分,可是成本却远远超过5分,这里意思意思吧~)
- 2021-05-06下载
- 积分:1
-
地震数据segy读取的MATLAB函数
由Thomas Mejer Hansen编写,读取Segy数据,提取道头和卷头信息,以及GUI包
- 2020-12-10下载
- 积分:1
-
QGraphicsView框架实现画板
支持图形的绘制,移动与拖拽、放大缩小、旋转、复制粘贴、撤销重做;绘制图形包括矩形、多边形、椭圆、直线、曲线等
- 2020-12-02下载
- 积分:1
-
直流电机双闭环控制模型
直流电机位置速度双闭环控制模型,PID控制,可以直接运行。
- 2020-11-28下载
- 积分:1
-
Matlab实现二值图像的边缘检测 getedge.m
一种面向数据点的二值图像边缘提取的方法。通过对图像的四个角度的取底,将图像的四个边缘提取出来,最后合成一个整体的图像边缘。这种方法所提取的边缘只有一个像素点,可以用于图像的计数。
- 2020-12-11下载
- 积分:1
-
Matlab气体模拟扩散编程代码
要求用matlab编程模拟分子碰撞,演示气体扩散情况。本实验中的模型采用简化形式,所发生碰撞均为完全弹性碰撞。
- 2020-11-30下载
- 积分:1
-
机器人手眼标定-Matlab程序(高精度)
【实例简介】最近做科研用到手眼系统标定,在网上搜索方法无果,于是自己亲自编写手眼标定程序,经验证,具有较高精度。
1.用Matlab进行相机标定;
2.将机器人末端位姿存储在res(res是存储与采集图像对应的机器人末端位姿旋转矩阵的空间)中;
3.运行手眼标定程序。
- 2021-11-19 00:32:21下载
- 积分:1
-
最精确的高程异常高程转换软件
高程异常计算,GPS高程转换,可快速对各经纬度地区的高程异常进行获得,从而用GPS的大地高得到正常高
- 2020-12-05下载
- 积分:1
-
python100道面试题及解答()全部答案 pycharm 测试过 py3环境)
python面试题100道答案全部 一般的只写了30个答案题目大概有1、一行代码实现1--100之和2、如何在一个函数内部修改全局变量利用global 修改全局变量3、列出5个python标准库os:提供了不少与操作系统相关联的函数sys: 通常用于命令行参数re: 正则匹配math: 数学运算datetime:处理日期时间
- 2020-12-11下载
- 积分:1