-
cuda并行计算
资源描述VS_cuda并行计算 两基于vs实现的.cu代码 简单的实现矩阵相乘和反转。
- 2022-05-21 15:38:13下载
- 积分:1
-
视频游戏的流体模拟,第 5 部分
性能分析与优化
这篇文章,在一系列,第五描述的性能分析和优化的流体模拟,提出了一种在第三和第四条款中。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了一个旋涡粒子流体模拟与双向流体体之间的相互作用,它运行在真正的时间。这篇文章利用另一个功能的英特尔 ® 线程构建模块 (英特尔 ® TBB) 将更多的工作分散到多个线程。这篇文章描述 CPU 使用情况分析过程,并使用该信息来优化和进一步并行化的代码,使其运行得更快。
性能分析和优化本文中描述的过程中的许多镜子中所述的程序软件优化食谱。这一过程从开始创建基准 — — 一大块的代码用来量化正在优化算法的性能。其余的过程需要迭代上的三个步骤:
要找出所谓的"热点",应用程序在哪里花费其大部分时间的配置文件。
探讨为什么热点会消耗很多时间的详细信息。
修改,试图让它更快的代码。
将这些步骤应用于流体模拟应用程序在前两篇文章中提出了这条记载。
相关的文章
流体模拟视频游戏 (第1部分)
流体模拟视频游戏 (第 2 部分)
流体模拟视频游戏 (第 3 部分)
流体模拟视频游戏 (第 4 部分)
流体模拟视频游戏 (第 5 部分)
流体
- 2022-05-18 08:33:08下载
- 积分:1
-
MFC调用CUDA
如何在MFC中调用CUDA
环境: Windows Vista SP1
Microsoft Visual Studio 2005
CUDA 2.0
步骤:
1. 创建一个对话框的
- 2023-04-01 09:30:04下载
- 积分:1
-
视频游戏的流体模拟,第 6 部分
差动速度算法器
这篇文章,在一系列,第六描述从根本上不同的方法计算速度从涡度,提出了在这些文章中的流体模拟的基石之一。第一篇文章总结了流体动力学 ;第二个调查流体仿真技术 ;和第三和第四次提出了涡粒子流体模拟与双向流体体之间的相互作用,在真正的时间运行。第五篇文章展示了如何获取和使用 CPU 使用率分析数据,优化,进一步并行化的代码,这样,它跑得更快。
这篇文章介绍一种求解速度从涡度的微分技术和与第 3 部分中所提出的积分 treecode 技术及其成果和业绩形成鲜明对比。泊松规划求解在这篇文章提出了一种比跑得快 treecode,但它的结果看起来不同的可能不那么令人满意。
涡旋速度,回顾
记得第二篇文章,您可以计算速度从涡度 请点击左侧文件开始预览 !预览只提供20%的代码片段,完整代码需下载后查看 加载中 侵权举报
- 2022-02-05 03:15:32下载
- 积分:1
-
I2C driver
I2C总线驱动,8位单片机适用。
在总线控制,并下发指令是,效率好,另外,此程序在keil编译器中已经编译通过。
- 2022-01-31 04:15:49下载
- 积分:1
-
GPU CUDA 的矩阵SOR
SOR(Successive Over-Relaxation) 又名逐次超松弛法,是解决微分方程的一种通用算法,主要应用在解决拉普拉斯方程、肥皂泡形状等的问题上。本程序使用CUDA来实现sor,并且包含两种方法,一种是单一block运算整个矩阵,每个thread运算矩阵中的一个方块。一种是多个block运算整个矩阵,每个thread运算矩阵中的一个点。该程序有良好的注释,适合初学者学习。
- 2022-09-25 08:50:03下载
- 积分:1
-
PI值的并行处理
A console application that estimates the value of PI using a variety of both serial and parallel implementations, the latter done with both PLINQ and the Parallel class.
- 2022-01-22 07:33:28下载
- 积分:1
-
在 win32 中的多线程应用程序
在 win32 中的 Multithreadingapplications。C 编程在多线程环境中的 windows levelapplication 源代码。Multithreadin windows 系统很好的书。
- 2022-10-17 09:15:15下载
- 积分:1
-
细胞生命的模拟化
This application provides an implementation of Conway’s Game of Life, using the Parallel class to parallelize the processing of the cellular automata.
- 2022-06-29 16:39:03下载
- 积分:1
-
并行分布实现矩阵乘法
资源描述
基于集群,测试后可用。
实现了并行分布式求解矩阵的幂。
基于消息传递的机制。主进程负责分配任务。各个子进程复杂计算。
通过分块,有效的解决了内存不足的问题。
- 2023-07-19 07:35:03下载
- 积分:1