
零 · 前言
最近忙了一些技术之外的事情,耽搁了蛮多的时间的,好久没更新了,懈怠了!抱歉哇!
紧接上次《CPU体系结构之手排流水线专题一》应该是写《CPU体系结构之手排流水线专题0x02》了的,但是考虑到其中我会用到我写的那个PowerPerf工具,因此有必要在这之前简单介绍下我的这个工具:
再说下业内有哪些在用的perf工具,优点以及不足,然后我的这个优点又是啥?
接着,说下我这个是怎么做的,技术架构是啥?
结合实例说明下我这个工具的精度如何?
最后在实际卷积算子的撰写过程中说明这个工具能做到些啥,解决啥问题!
好吧,那。。。我们开始吧!
壹 · perf背景介绍
关于perf的介绍,这里有大佬整体介绍过了的:
恒生研究院:超全整理!Linux性能分析工具汇总合集zhuanlan.zhihu.com

简单来说就是linux系统在驱动级别就提供了一整套的perf接口,能做很多事!能在应用函数级别perf到很多的数据的呀!比如你看下面能获得各个函数的一些event数据!
