-
GPU上CUDA实现N-Body
应用背景在GPU上实现N-BODY算法。N-Body模拟问题覆盖了自然科学的很多领域,从宇观的天体物理到宏观的流体动力学,直至微观的分子动力学。例如通过研究围绕着银河系的暗物质晕轮的形状和动力学特征来探索银河系形成过程,需要模拟数百万的星体和暗物质间的作用。现代生物物理学和化学中的许多研究,如细菌或植物体的光合作用膜处发生的光能向化学能的转化,染色体中DNA和蛋白质分子的描述,都需要模拟上千万的原子核分子的作用。关键技术N-Body问题的两个重要特征是: 第一点.计算规模大,因为无论是宇观的天体尺寸还是微观的分 子尺度.都包含了大量的粒子,粒子的规模大到数百万、千万。由于在 系统中任意的两个粒子问都存在着相互作用,因此商接计算粒子间的 相互作用的量级就是O(N^2); 第二点.系统是动态变化的。为了反应系统的具体变化.尤其是在微观分子结构中.要求时间步足够小。这两个特征决定了计算机模拟 时巨大的计算量。这对于任何扁性能的单台计算机来说都是一个很难突破的瓶颈.因此采用并行汁算是解决N-Body问题的必然选择。主要涉及数据划分和线程任务划分实现。
- 2022-12-08 07:20:03下载
- 积分:1
-
fpga vga 控制器设计
我听说很多积极的反馈,从几个星期我们回来的统合 NERP FPGA 车间。一些人问我要去我们做两个演示的 Verilog 邮编。我添加了评论到 Verilog 文件试图清理我们顺利挺进避免纯粹把这变成 Verilog 类的东西很多。最有用的评论将在 VGA 控制器模块我们 wrote:vga640x480.v。不管怎么说,所有所需的项目文件,合成我们写的逻辑都在这里:我听说很多积极的反馈,从几个星期我们回来的统合 NERP FPGA 车间。一些人问我要去我们做两个演示的 Verilog 邮编。我添加了评论到 Verilog 文件试图清理我们顺利挺进避免纯粹把这变成 Verilog 类的东西很多。最有用的评论将在 VGA 控制器模块我们 wrote:vga640x480.v。不管怎么说,所有所需的项目文件,合成我们写的逻辑都在这里:
- 2022-03-23 00:30:18下载
- 积分:1
-
研究生DSP实验
本次实验主要目的是熟悉VISUALDSP++的开发环境。针对ADSP-TS201,利用几个用C、C++和汇编语言写成的简单例子来描述VISUAL DSP++编程环境和调试器(debugger)的主要特征和功能。对于运行在其它类型TS20x处理器的程序只需对其链接描述文件(.
- 2022-05-28 04:53:57下载
- 积分:1
-
多目标遗传算法优化
研究多目标遗传算法的优化,包含遗传算法过程中涉及的的各个步骤,非常适合于研究遗传算法及对遗传算法进行多目标优化的同学
- 2022-01-25 17:35:18下载
- 积分:1
-
openmp+cuda 加速视频中彩色图像转换为灰度图像,提取视频图像中的边缘
目的:加速视频中彩色图像转换为灰度图像,提取视频图像中的边缘。 开发环境:windows 8.1 x64操作系统 vs2012 cuda5.5 opencv2.4.8 硬件环境:NVIDIA GeForce GT 740M ,4G内存,Intel(R) Core(TM) i5-4200MCPU @2.50GHz 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
- 2022-08-18 21:36:49下载
- 积分:1
-
异步PHP代码实现
一种异步实现php调用的方法,欢迎下载,希望对大家能有帮助。谢谢大家的支持!
- 2022-02-26 08:58:13下载
- 积分:1
-
视频游戏的流体模拟,第 6 部分
差动速度算法器
这篇文章,在一系列,第六描述从根本上不同的方法计算速度从涡度,提出了在这些文章中的流体模拟的基石之一。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了涡粒子流体模拟与双向流体体之间的相互作用,在真正的时间运行。第五篇文章展示了如何获取和使用 CPU 使用率分析数据,优化,进一步并行化的代码,这样,它跑得更快。
这篇文章介绍一种求解速度从涡度的微分技术和与第 3 部分中所提出的积分 treecode 技术及其成果和业绩形成鲜明对比。泊松规划求解在这篇文章提出了一种比跑得快 treecode,但它的结果看起来不同的可能不那么令人满意。
涡旋速度,回顾
记得第二篇文章,您可以计算速度从涡度 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
- 2022-02-05 03:15:32下载
- 积分:1
-
GPU CUDA 的矩阵SOR
SOR(Successive Over-Relaxation) 又名逐次超松弛法,是解决微分方程的一种通用算法,主要应用在解决拉普拉斯方程、肥皂泡形状等的问题上。本程序使用CUDA来实现sor,并且包含两种方法,一种是单一block运算整个矩阵,每个thread运算矩阵中的一个方块。一种是多个block运算整个矩阵,每个thread运算矩阵中的一个点。该程序有良好的注释,适合初学者学习。
- 2022-09-25 08:50:03下载
- 积分:1
-
spark apriori算法实现代码
应用背景
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
关键技术频繁项集挖掘采用spark实现的并行化挖掘算法。并行的apriori算法采用scala编写,并行的apriori采用java编写。里面会有较多函数使编程的内容。
- 2022-02-02 20:25:06下载
- 积分:1
-
cuda实现矩阵求逆
此程序包的矩阵求逆函数基于 CUDA 的实现包含对称的积极明确逆矩阵使用 GPU。用法,请参阅 testspd.cpp 中的示例。此外,一般块矩阵求逆通过高斯(pivotting) 没有消除。请参阅 testge.cpp 例如使用。注: GE 可能无法在单精度足够稳定。请参阅生成文件更改为双精度。
- 2022-07-16 13:09:40下载
- 积分:1