-
secuential归并排序
secuential归并排序
- 2022-05-09 00:14:19下载
- 积分:1
-
mapreduce下矩阵相乘——内积方法
左矩阵A是m×s,右矩阵B是s×n,结果矩阵C是m×n。
- 2023-01-06 10:40:03下载
- 积分:1
-
GPU上CUDA实现N-Body
应用背景在GPU上实现N-BODY算法。N-Body模拟问题覆盖了自然科学的很多领域,从宇观的天体物理到宏观的流体动力学,直至微观的分子动力学。例如通过研究围绕着银河系的暗物质晕轮的形状和动力学特征来探索银河系形成过程,需要模拟数百万的星体和暗物质间的作用。现代生物物理学和化学中的许多研究,如细菌或植物体的光合作用膜处发生的光能向化学能的转化,染色体中DNA和蛋白质分子的描述,都需要模拟上千万的原子核分子的作用。关键技术N-Body问题的两个重要特征是: 第一点.计算规模大,因为无论是宇观的天体尺寸还是微观的分 子尺度.都包含了大量的粒子,粒子的规模大到数百万、千万。由于在 系统中任意的两个粒子问都存在着相互作用,因此商接计算粒子间的 相互作用的量级就是O(N^2); 第二点.系统是动态变化的。为了反应系统的具体变化.尤其是在微观分子结构中.要求时间步足够小。这两个特征决定了计算机模拟 时巨大的计算量。这对于任何扁性能的单台计算机来说都是一个很难突破的瓶颈.因此采用并行汁算是解决N-Body问题的必然选择。主要涉及数据划分和线程任务划分实现。
- 2022-12-08 07:20:03下载
- 积分:1
-
GPU CUDA 的矩阵SOR
SOR(Successive Over-Relaxation) 又名逐次超松弛法,是解决微分方程的一种通用算法,主要应用在解决拉普拉斯方程、肥皂泡形状等的问题上。本程序使用CUDA来实现sor,并且包含两种方法,一种是单一block运算整个矩阵,每个thread运算矩阵中的一个方块。一种是多个block运算整个矩阵,每个thread运算矩阵中的一个点。该程序有良好的注释,适合初学者学习。
- 2022-09-25 08:50:03下载
- 积分:1
-
冒泡排序的MPI并行C
应用背景读取一个文本文件包含数字(小于2E8),它存储在一个动态数组的冒泡排序法,并打印出另一个文本文件。在终端中返回每个进程的运行时。如果该参数没有指定,默认为一个叫做“Sal txt文件。”(必须保存在当前目录),如果参数定义的文件进入参数与数组排序。关键技术泡沫排序,有时也称为“下沉排序”,是一个简单的排序算法,通过列表中的重复步骤来进行排序,比较每一对相邻的项目,如果它们是错误的顺序。通过列表的传递,直到不需要进行任何交换,这说明列表是排序的。这是一个比较排序的算法,它被命名为较小的元素“泡沫”到列表的顶部。虽然算法简单,但对于大多数问题来说,它是太慢和不切实际的,即使在插入排序。[ 1 ]它可以是实际的,如果输入通常是按排序顺序,但可能会偶尔有一些顺序元素的位置近。
- 2023-01-14 11:15:03下载
- 积分:1
-
OpenMP并行计算的例子
openmp,并行计算是提高代码效率的非常有用的处理方法;
这是一个全面的openmp的使用例子;可以从类似编译条件的方式使用MP,
学习OPENMP让,程序飞起来!
- 2022-04-08 19:24:46下载
- 积分:1
-
福克斯矩阵计算
狐狸的算法,一个简单的实现每个进程的一个元素。在一个充分实现 A、 B、 C、 T将矩阵。
- 2023-09-08 02:00:03下载
- 积分:1
-
视频游戏的流体模拟,第 5 部分
性能分析与优化
这篇文章,在一系列,第五描述的性能分析和优化的流体模拟,提出了一种在第三和第四条款中。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了一个旋涡粒子流体模拟与双向流体体之间的相互作用,它运行在真正的时间。这篇文章利用另一个功能的英特尔 ® 线程构建模块 (英特尔 ® TBB) 将更多的工作分散到多个线程。这篇文章描述 CPU 使用情况分析过程,并使用该信息来优化和进一步并行化的代码,使其运行得更快。
性能分析和优化本文中描述的过程中的许多镜子中所述的程序软件优化食谱。这一过程从开始创建基准 — — 一大块的代码用来量化正在优化算法的性能。其余的过程需要迭代上的三个步骤:
要找出所谓的"热点",应用程序在哪里花费其大部分时间的配置文件。
探讨为什么热点会消耗很多时间的详细信息。
修改,试图让它更快的代码。
将这些步骤应用于流体模拟应用程序在前两篇文章中提出了这条记载。
相关的文章
流体模拟视频游戏 (第1部分)
流体模拟视频游戏 (第 2 部分)
流体模拟视频游戏 (第 3 部分)
流体模拟视频游戏 (第 4 部分)
流体模拟视频游戏 (第 5 部分)
流体
- 2022-05-18 08:33:08下载
- 积分:1
-
并行程序设计_三角函数并行化程序设计
1) 熟练掌握并行程序设计的基本方法;
2) 通过实验,了解并行程序设计的过程以及优越性;
3) 学会并行程序的算法分析;
4) 结合高等工程数学、分布式系统、云计算等相关课程知识解决简单的实际问题。
- 2022-03-01 04:29:27下载
- 积分:1
-
spark apriori算法实现代码
应用背景
Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。
关键技术频繁项集挖掘采用spark实现的并行化挖掘算法。并行的apriori算法采用scala编写,并行的apriori采用java编写。里面会有较多函数使编程的内容。
- 2022-02-02 20:25:06下载
- 积分:1