登录
首页 » 并行计算 » GPU CUDA 的矩阵SOR

GPU CUDA 的矩阵SOR

于 2022-09-25 发布 文件大小:4.68 kB
0 214
下载积分: 2 下载次数: 1

代码说明:

SOR(Successive Over-Relaxation) 又名逐次超松弛法,是解决微分方程的一种通用算法,主要应用在解决拉普拉斯方程、肥皂泡形状等的问题上。本程序使用CUDA来实现sor,并且包含两种方法,一种是单一block运算整个矩阵,每个thread运算矩阵中的一个方块。一种是多个block运算整个矩阵,每个thread运算矩阵中的一个点。该程序有良好的注释,适合初学者学习。

下载说明:请别用迅雷下载,失败请重下,重下不扣分!

发表评论

0 个回复

  • 向量元素进排序
    该程序应用于并行排序算法Betchera。该算法属于一组并行排序的,这些算法之间的主要区别是并行(同时)作用于分选的数字数据集的可能性。class MyParSort Classvoid Setup  请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
    2022-03-23 19:22:26下载
    积分:1
  • fpga vga 控制器设
    我听说很多积极的反馈,从几个星期我们回来的统合 NERP FPGA 车间。一些人问我要去我们做两个演示的 Verilog 邮编。我添加了评论到 Verilog 文件试图清理我们顺利挺进避免纯粹把这变成 Verilog 类的东西很多。最有用的评论将在 VGA 控制器模块我们 wrote:vga640x480.v。不管怎么说,所有所需的项目文件,合成我们写的逻辑都在这里:我听说很多积极的反馈,从几个星期我们回来的统合 NERP FPGA 车间。一些人问我要去我们做两个演示的 Verilog 邮编。我添加了评论到 Verilog 文件试图清理我们顺利挺进避免纯粹把这变成 Verilog 类的东西很多。最有用的评论将在 VGA 控制器模块我们 wrote:vga640x480.v。不管怎么说,所有所需的项目文件,合成我们写的逻辑都在这里:
    2022-03-23 00:30:18下载
    积分:1
  • 多目标遗传法优化
    研究多目标遗传算法的优化,包含遗传算法过程中涉及的的各个步骤,非常适合于研究遗传算法及对遗传算法进行多目标优化的同学
    2022-01-25 17:35:18下载
    积分:1
  • PI值的处理
    A console application that estimates the value of PI using a variety of both serial and parallel implementations, the latter done with both PLINQ and the Parallel class.
    2022-01-22 07:33:28下载
    积分:1
  • cuda实现矩阵求逆
    此程序包的矩阵求逆函数基于 CUDA 的实现包含对称的积极明确逆矩阵使用 GPU。用法,请参阅 testspd.cpp 中的示例。此外,一般块矩阵求逆通过高斯(pivotting) 没有消除。请参阅 testge.cpp 例如使用。注: GE 可能无法在单精度足够稳定。请参阅生成文件更改为双精度。
    2022-07-16 13:09:40下载
    积分:1
  • 基于Hadoop的文本分类(1)-文本预处理&文本表示
    资源描述一、环境环境:Ubuntu14、Hadoop2.6,Eclipse、NLPIR/ICTCLAS2015等; 二、算法简介: 1、此项目是基于Hadoop2.6进行MapReduce并行开发; 2、此项目是文本分类的文本预处理和文本表示部分,包括分词,去停用词,特征选择和文本表示等(分类算法采用的是随机森林算法,暂时未开放,读者可自行采用Mahout或Weka进行验证); 3、分词采用的是NLPIR/ICTCLAS2015;文本表示采用的是VSM模型,权重计算采用TFIDF进行文本表示;特征选择采用CHI算法(卡方统计); 4、关于并行分词环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4917665.html 5、关于Hadoop环境搭建,可参考我的博客http://www.cnblogs.com/merru/p/4901528.html和http://www.cnblogs.com/merru/p/4905118.html。
    2022-03-01 12:43:10下载
    积分:1
  • 视频游戏的流体模拟,第 3 部分
    涡粒子流体模拟 这篇文章,第三个在一系列,介绍了在 c + + 中使用谦虚,通常可用计算机硬件实时运行中实现流体模拟。第一篇文章总结了流体动力学 ;第二个调查流体模拟技术。 仿真这里介绍用途涡粒子,称为vortons由诺维科夫 (1983),来代表的流场和每一次的速度解决了。这种战术的使用 vortons 保留涡度无明显来源的扩散,可以模拟保留细鳞的详细信息。相比之下,其他流体模拟技术,使用原始变量 (速度和压力) 或网格数值弥漫性涡度,所以流动往往看起来厚和糖浆。当你看到这种模拟的结果时,你会惊讶于它保留了,多少议案详细考虑它跑得多快。 这种模拟也利用令人尴尬的并行算法的性质,并使用英特尔 ® 线程构建模块(英特尔 ® TBB) 跨越多个线程的工作。 在努力实现实时的流体运动,一些其他流体模拟利用图形处理单元 (GPGPU) 通用计算。
    2022-04-29 19:04:05下载
    积分:1
  • OpenMP的例子
    openmp,并行计算是提高代码效率的非常有用的处理方法; 这是一个全面的openmp的使用例子;可以从类似编译条件的方式使用MP, 学习OPENMP让,程序飞起来!
    2022-04-08 19:24:46下载
    积分:1
  • 的比较
    访问邻居 PC 零售商店提供了充足的证据,我们是在多核时代。厂商之间的关键区别今天是他们打包到单个芯片上的内核的数量。商品处理器的时钟频率已经达到了极限,然而,和很可能保持在以下 4 GHz 多年来。因此,加入内核是不增加计算能力的代名词。要充分利用提供的新的多核硬件的性能增强,相应地调整必须发生在软件基础设施 — — 转变为并行计算。
    2022-08-13 04:18:03下载
    积分:1
  • 研究生DSP实验
    本次实验主要目的是熟悉VISUALDSP++的开发环境。针对ADSP-TS201,利用几个用C、C++和汇编语言写成的简单例子来描述VISUAL DSP++编程环境和调试器(debugger)的主要特征和功能。对于运行在其它类型TS20x处理器的程序只需对其链接描述文件(.
    2022-05-28 04:53:57下载
    积分:1
  • 696516资源总数
  • 106442会员总数
  • 11今日下载