CUDA atomic原子操作

最新推荐文章于 2024-11-05 21:48:55 发布

weixin_30657999

最新推荐文章于 2024-11-05 21:48:55 发布

阅读量2.2k

点赞数 2

CC 4.0 BY-SA版权

文章标签： python

原文链接：http://www.cnblogs.com/mtcnn/p/9411865.html

CUDA的原子操作用于在并行线程间安全地处理共享变量，包括add、sub、exch、min、max、inc、dec、CAS等操作，确保多线程间的互斥访问。这些操作在全局和共享内存中执行，提供了对并发读写的保护，但可能牺牲性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

CUDA的原子操作可以理解为对一个变量进行“读取-修改-写入”这三个操作的一个最小单位的执行过程，这个执行过程不能够再分解为更小的部分，在它执行过程中，不允许其他并行线程对该变量进行读取和写入的操作。基于这个机制，原子操作实现了对在多个线程间共享的变量的互斥保护，确保任何一次对变量的操作的结果的正确性。

原子操作确保了在多个并行线程间共享的内存的读写保护，每次只能有一个线程对该变量进行读写操作，一个线程对该变量操作的时候，其他线程如果也要操作该变量，只能等待前一线程执行完成。原子操作确保了安全，代价是牺牲了性能。

CUDA支持多种原子操作，常用的如下:

1、 atomicAdd()

int atomicAdd(int* address, int val);
unsigned int atomicAdd(unsigned int* address,unsigned int val);
unsigned long long int atomicAdd(unsigned long long int* address,unsigned long long int val);

读取位于全局或共享存储器中地址address 处的32 位或64 位字old，计算(old + val)，并将结果存储在存储器的同一地址中。这三项操作在一次原子事务中执行。该函数将返回old。只有全局存储器支持64 位字。

2、 atomicSub()

int atomicSub(int* address, int val);
unsigned int atomicSub(unsigned int* add