CUDA 冬令营1

基本概念

1.CPU的任务:为串行任务优化
2.GPU的任务:为并行任务优化
3.L4T ubuntu:基于NVIDIA Tegra芯片的ubuntu系统(linux for Tegra)
4.Tegra:继承了ARM CPU 和 NVIDIA GPU的处理器芯片
5.X86:高性能,复杂指令,多用于win
6.ARM:低功耗高效率,简易指令集,Linux
7.GPU的产生:CPU的两个瓶颈 存储器墙(IO跟不上)时钟频率墙(散热)

CPU到GPU

所有的处理优化逻辑变成计算核心
在这里插入图片描述
在这里插入图片描述在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

CUDA线程层次

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
block的意义:(为什么不直接用通过grid管理所有的thread)不用直接去分配N个线程 分班去管理 有利于内存管理
GPU上运行函数kernel对应一个Grid,每个Grid内有多个Block,每个Block由多个Thread组成。
执行原理参考1
执行原理参考2
硬件层面:一个DEVICE由多个SM和其他资源组成,一个SM由多个SP(CUDA Core)和其他资源组成
软件层面:一个Grid由多个block组成,Block由多个Thread组成,Block内的Thread可以通过共享内存通信,也可以通过函数同步
线程调度:CUDA的线程调度粒度是32个Thead,即1个Warp,Warp在SP上是随机且多次被调度执行的,Warp的切换开销可以忽略不计。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值