登录
首页 » 算法 » cuda实现矩阵相乘实例

cuda实现矩阵相乘实例

于 2022-06-16 发布 文件大小:11.24 MB
0 138
下载积分: 2 下载次数: 1

代码说明:

CUDA矩阵相乘A*B=C代码,任意输入矩阵A的宽度和矩阵B的宽度(A[wB][wA]*B[wA][wB]),cudaMallocPitch开辟显存空间,cudaMemcpy2D数组复制,Kahan"s Summation Formula提高浮点计算精度。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 该程序为动态规划得图论求解程序 好不好用了就知道
    该程序为动态规划得图论求解程序 好不好用了就知道 -The procedure for the dynamic programming procedure for solving a graph theory better use of the know
    2022-01-24 09:39:00下载
    积分:1
  • Segmentations procedures very well. Absolutely concise
    分段算法的程序,很好的。绝对简练-Segmentations procedures very well. Absolutely concise
    2023-06-15 03:45:03下载
    积分:1
  • 常用的c语言实现,包括一些经典的比如,最小二乘,插值与逼近等等!...
    常用算法的c语言实现,包括一些经典的比如,最小二乘,插值与逼近等等!-Commonly used algorithm c language, including some classic example, least squares, interpolation and approximation, etc.!
    2023-04-19 12:15:03下载
    积分:1
  • datamatrix编码和解码的程序,没有原码
    datamatrix编码和解码的程序,没有原码
    2022-07-03 03:17:46下载
    积分:1
  • / = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = /功能annot
    //=== === === === === === === = //函数说明 //函数名称:PolyFit //函数功能:最小二乘法曲线拟合 //使用方法:double *x ---- 存放n个数据点的X坐标 // double *y ---- 存放n个数据点的Y坐标 // int n -------- 给定数据点个数 // double *a ---- 返回m-1次拟合多项式的m个系数 // int m -------- 拟合多项式的项数,即拟合多项式的最高次为m-1。要求m20,则本函数自动按m=min{n,20}处理 // double *dt --- dt[0]返回拟合多项式与各数据点误差的平方和;dt[1]返回拟合多 // 项式与各数据点的误差绝对值之和;dt[2]返回拟合多项式与各数据 // 点误差绝对值的最大值 //注意事项:拟合多项式的形式为 y = b0 + b1*(x-Xavr)... -//=== === === === === ==== === === === === === === ==== === =// function annotations// function name : PolyFit// Function functions : Least Squares Curve Fitting// Use : double* x n-store data point coordinates of the X//* y double-storage n data point Y coordinates// int n-------- given the number of data points//* a double---- returned to the m-1 m fit polynomial coefficients// int m-------- polynomial fitting items , which is the highest polynomial fitting time for m-1. Request m
    2023-07-25 11:15:03下载
    积分:1
  • rotation matrix algorithm
    旋转矩阵的实现算法-rotation matrix algorithm
    2022-03-10 02:23:35下载
    积分:1
  • java数据结构小程序
    一个java写的hash算法,学习java的和算法的朋友可以参考下,也是网上大家讨论的在这里总结下给大家
    2022-07-27 16:35:00下载
    积分:1
  • 利用有限元流体计求解器的准备,包括你的使用…
    一个用fortran90编写有限元流体求解器,包括使用源代码,输出文件和单元文件,推荐学习使用-Prepared using a finite element fluid fortran90 solver, including the use of source code, the output file and the unit document and recommend learning to use
    2022-02-03 11:34:16下载
    积分:1
  • 增量学习的鲁棒性的视觉跟踪
    大多数算法用于跟踪视频中的对象由两个部分组成: 被跟踪对象的动力学模型和它的外观模型。外观模型是经常跟踪,也许从训练图像之前建造,然后用作-时,跟踪测试序列。 如果测试序列中不包含的对象或照明条件下,不确切地匹配那些训练数据的外观吗?通常情况下,追踪与固定的外观模型将在这些情况下表现不佳。 在这个项目中不能使用期间跟踪增量改进目标的子空间外观模型来提供了新的外观信息。这种算法的关键是一种新的增量算法为 PCA,允许高效的子空间更新。
    2022-01-26 04:21:15下载
    积分:1
  • 左侧的边缘路由的超大规模集成电路
    通道是两个平行的终端所包围的路由区域。通道路由算法的主要目的是尽量减少通道高度。左边缘 algorithm(LEA) 被开发的通道布线的第一种算法。芯片放置在行与行之间和在董事会之下的领域分为矩形通道。左侧边缘算法总是发现一种解决方案的行数等于下限
    2022-07-27 01:45:29下载
    积分:1
  • 696518资源总数
  • 106155会员总数
  • 8今日下载