解读CUDA Compiler Driver NVCC - Ch.5

本文深入解析了CUDA Compiler Driver NVCC的工作原理,重点介绍了--gpu-architecture和--gpu-code选项,以及它们的缩写形式和扩展用法。通过具体的命令示例,阐述了如何指定虚拟架构和真实架构,以及在编译过程中如何处理不同GPU架构的支持情况。此外,还提及了__CUDA_ARCH__宏在GPU函数实现中的作用。

前言


前面几篇文章,我们了解了NVCC的作用,nvcc编译的two stage, 每个stage做了什么,怎么去选择虚拟架构和真实架构,JIT编译的原理,好处和弊端以及解决方案。本文我们将了解几个实际的nvcc编译命令。

Base Notation


nvcc提供了选项--gpu-architecture和--gpu-code。

--gpu-architecture只能选择一个值,用来指定虚拟架构的名称,如下:

--gpu-architeture=compute_50

--gpu-code可以选择一系列的真实GPU架构,如下:

--gpu-code=sm_50,sm_52

nvcc命令

nvcc x.cu --gpu-architecture=compute_50 --gpu-code=sm_50,sm_52

Shorthand

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值