面向移动/嵌入式平台的算子性能调优工具箱
特征。
调查目标 CPU/GPU 的基本微架构参数 (uarch)。
绘制分层屋顶线模型的图形,用于评价性能。
收集CPU/GPU PMU事件数据。
分析CPU/GPU PMU事件数据(TMA方法论和自定义指标),用于识别性能瓶颈。
OpenCL Linter,用于指导手动 OpenCL 内核优化 [TBD]。
C++项目
支持平台:ARM CPU、Mali GPU、Adreno 6xx GPU
轻量级和可填充的库
iOS 平台尚未完全开发使用。
mperf |
路线图 |
应用