TVM神经编译器

原创已于 2022-11-04 19:39:04 修改 · 1.7k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

于 2022-11-03 19:47:09 首次发布

芯片专栏收录该内容

2 篇文章

订阅专栏

文章目录

什么是TVM
TVM能做什么
- how to use TVM

什么是TVM

本部分参考 “TVM等神经编译器概览：它是连接深度学习框架和硬件的桥梁” ，讲解通俗易懂

传统的编译器：LLVM（low level virtual machine）

在这里插入图片描述
LLVM通过模块分为前端，中端（优化）和后端三部分。每当出现新的编程语言，只需要开发相应的前端，将编程语言转换成LLVM的中间表示；类似地，出现新的硬件架构，只需要开发相应的后端，对接上LLVM的中间表示。

神经网络编译器

在这里插入图片描述

神经网络编译器：输入是深度学习训练框架训练出来的模型定义文件，输出是能够在不同硬件高效执行的代码。

最上层对接各个深度学习训练框架训练出来的算法模型（Tensorflow, Caffe, Pytorch, Mxnet等）。
图层级（High-level IR）：神经网络的结构可以表示成计算图，图层级的操作则是对计算图进行一些和具体硬件和框架无关的操作，比如算子融合，内存分配优化，数据类型和数据维度的推导等。
算子层级（operator level/kernel level）算子层级主要是张量计算。为了实现这些计算在硬件上高效实现，发挥芯片的性能，通常硬件芯片配有专门优化的算子计算库，如Intel的MKL, Nvidia的CuDNN, TensorRT。这个层级需要支持每个硬件后端的算子实现。
各硬件后端：GPU, ARM CPU, X86 CPU, NPU等。

在这里插入图片描述
各类深度学习编译器，其实TVM（tensor virtual machine) 较为突出。

TVM（tensor virtual machine)

在这里插入图片描述

最高层级支持主流的深度学习前端框架，包括TensorFlow,MXNet,Pytorch等。
Relay IR支持可微分，该层级进行图融合，数据重排等图优化操作。
基于tensor张量化计算图，并根据后端进行硬件原语级优化，autoTVM根据优化目标探索搜索空间，找到最优解。
后端支持ARM、CUDA/Metal/OpenCL、加速器VTA（Versatile Tensor Accelerator）。

TVM能做什么

帮助深度学习模型部署在一些常规编译器不支持的硬件上；
TVM编译后的模型可以获得更快的推理速度
software supprort

how to use TVM

常规的神经网络层有很多矩阵运算，每一个简单的矩阵乘/加背后都对应一套非常负责的手动设计的算子计算（比如上万行的tflite）。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。