登录
首页 » 并行计算 » implementation of the multiplication of two double matrices by using MATLAB C-Mex and CUBLAS library

implementation of the multiplication of two double matrices by using MATLAB C-Mex and CUBLAS library

于 2022-07-17 发布 文件大小:39.95 kB
0 118
下载积分: 2 下载次数: 2

代码说明:

本文介绍了一个通过GPU CUDA实现两个双矩阵相乘的MATLAB运算包。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • OpenMP的例子
    openmp,并行计算是提高代码效率的非常有用的处理方法; 这是一个全面的openmp的使用例子;可以从类似编译条件的方式使用MP, 学习OPENMP让,程序飞起来!
    2022-04-08 19:24:46下载
    积分:1
  • 同构DVS集群中基于自适应阈值的任务节能调度
    资源描述目前,高能效的并行任务调度算法设计已经成为集群系统的研究热点.现有基于复制的节能调度算法主要利用阈值平衡系统的性能和能耗,但随机设置的阈值无法根据性能需求和环境参数等特征自动调节,导致调度算法存在一定的局限性.文中提出一种面向同构集群系统的两阶段节能调度算法ATES(Adaptive Threshold-based Energy-efficient Scheduling).首先,设计一种基于自适应阈值的任务复制策略,该策略能够自动计算最佳阈值,利用该阈值获取近似最优的任务分组.然后,将各分组任务调度到支持DVS的处理器上,并充分利用任务之间的空闲时间降低处理器电压.该算法将任务复制策略与电压调节技术有机结合,在调度过程中能够自动调整阈值,有效提高调度算法的能效.为了验证ATES算法的合理性,通过典型应用进行仿真实验,并与常见任务调度算法进行比较,结果表明ATES算法能够更好地实现性能和能耗之间的平衡.
    2022-04-25 05:27:51下载
    积分:1
  • cuda实现矩阵求逆
    此程序包的矩阵求逆函数基于 CUDA 的实现包含对称的积极明确逆矩阵使用 GPU。用法,请参阅 testspd.cpp 中的示例。此外,一般块矩阵求逆通过高斯(pivotting) 没有消除。请参阅 testge.cpp 例如使用。注: GE 可能无法在单精度足够稳定。请参阅生成文件更改为双精度。
    2022-07-16 13:09:40下载
    积分:1
  • GPU上CUDA实现N-Body
    应用背景在GPU上实现N-BODY算法。N-Body模拟问题覆盖了自然科学的很多领域,从宇观的天体物理到宏观的流体动力学,直至微观的分子动力学。例如通过研究围绕着银河系的暗物质晕轮的形状和动力学特征来探索银河系形成过程,需要模拟数百万的星体和暗物质间的作用。现代生物物理学和化学中的许多研究,如细菌或植物体的光合作用膜处发生的光能向化学能的转化,染色体中DNA和蛋白质分子的描述,都需要模拟上千万的原子核分子的作用。关键技术N-Body问题的两个重要特征是: 第一点.计算规模大,因为无论是宇观的天体尺寸还是微观的分 子尺度.都包含了大量的粒子,粒子的规模大到数百万、千万。由于在 系统中任意的两个粒子问都存在着相互作用,因此商接计算粒子间的 相互作用的量级就是O(N^2); 第二点.系统是动态变化的。为了反应系统的具体变化.尤其是在微观分子结构中.要求时间步足够小。这两个特征决定了计算机模拟 时巨大的计算量。这对于任何扁性能的单台计算机来说都是一个很难突破的瓶颈.因此采用并行汁算是解决N-Body问题的必然选择。主要涉及数据划分和线程任务划分实现。
    2022-12-08 07:20:03下载
    积分:1
  • 的比较
    访问邻居 PC 零售商店提供了充足的证据,我们是在多核时代。厂商之间的关键区别今天是他们打包到单个芯片上的内核的数量。商品处理器的时钟频率已经达到了极限,然而,和很可能保持在以下 4 GHz 多年来。因此,加入内核是不增加计算能力的代名词。要充分利用提供的新的多核硬件的性能增强,相应地调整必须发生在软件基础设施 — — 转变为并行计算。
    2022-08-13 04:18:03下载
    积分:1
  • implementation of the multiplication of two double matrices by using MATLAB C-Mex and CUBLAS library
    本文介绍了一个通过GPU CUDA实现两个双矩阵相乘的MATLAB运算包。
    2022-07-17 00:43:28下载
    积分:1
  • VB视屏聊天
    通过存储选中开始结束为止,确定颜色,仙剑一个文件夹,之后删除将恢复健康的和健康和vkjdfnkjkjn;k独守空房军看见电脑;来看看了呢空间能看见你空间呢控件看来今年 看你空间呢
    2022-12-07 06:20:02下载
    积分:1
  • 视频游戏的流体模拟,第 5 部分
    性能分析与优化 这篇文章,在一系列,第五描述的性能分析和优化的流体模拟,提出了一种在第三和第四条款中。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了一个旋涡粒子流体模拟与双向流体体之间的相互作用,它运行在真正的时间。这篇文章利用另一个功能的英特尔 ® 线程构建模块 (英特尔 ® TBB) 将更多的工作分散到多个线程。这篇文章描述 CPU 使用情况分析过程,并使用该信息来优化和进一步并行化的代码,使其运行得更快。 性能分析和优化本文中描述的过程中的许多镜子中所述的程序软件优化食谱。这一过程从开始创建基准 — — 一大块的代码用来量化正在优化算法的性能。其余的过程需要迭代上的三个步骤: 要找出所谓的"热点",应用程序在哪里花费其大部分时间的配置文件。 探讨为什么热点会消耗很多时间的详细信息。 修改,试图让它更快的代码。 将这些步骤应用于流体模拟应用程序在前两篇文章中提出了这条记载。 相关的文章 流体模拟视频游戏 (第1部分) 流体模拟视频游戏 (第 2 部分) 流体模拟视频游戏 (第 3 部分) 流体模拟视频游戏 (第 4 部分) 流体模拟视频游戏  (第 5 部分) 流体
    2022-05-18 08:33:08下载
    积分:1
  • PI值的处理
    A console application that estimates the value of PI using a variety of both serial and parallel implementations, the latter done with both PLINQ and the Parallel class.
    2022-01-22 07:33:28下载
    积分:1
  • Blend Images
    A demo of very simple image manipulation using a Parallel.For loop.  The application allows the user to load up two images and blends them together into a single, new image.        
    2022-07-27 17:53:54下载
    积分:1
  • 696522资源总数
  • 104049会员总数
  • 30今日下载