手把手建立Roofline模型(CPU)

Roofline模型原理

Roofline模型是由加州理工大学伯利克提出的用来建立当前计算平台在不同的计算强度(Operational Intensity)下能够达到的理论计算上限 。论文和基础理论和应用 Roofline Model与深度学习模型的性能分析 。本文旨在教授如何根据当前开发环境机器建立该模型,并简单的介绍如何根据算法计算OI(计算强度)。

公司主营业务:成都做网站、成都网站建设、成都外贸网站建设、移动网站开发等业务。帮助企业客户真正实现互联网宣传,提高企业的竞争能力。成都创新互联是一支青春激扬、勤奋敬业、活力青春激扬、勤奋敬业、活力澎湃、和谐高效的团队。公司秉承以“开放、自由、严谨、自律”为核心的企业文化,感谢他们对我们的高要求,感谢他们从不同领域给我们带来的挑战,让我们激情的团队有机会用头脑与智慧不断的给客户带来惊喜。成都创新互联推出柳城免费做网站回馈大家。

需要准备的硬件参数

对于CPU而言,我们需要一下参数:

频率 内存带宽(double) Avx512 Unit Fma
Intel® Xeon® Gold 6148 2.7GHz 39.74GB/s 2 2

其中Avx512、Fma并非是必备参数。

查询CPU相关指标方法或网站:

  • LINUX 下可以使用lscpu 查询.

计算相关参数:
当前CPU的理论峰值:

\[理论性能峰值 ={频率*512*AVX数量*FMA \over 32/64} \]
网站标题:手把手建立Roofline模型(CPU)
文章路径:http://ybzwz.com/article/dsoihhp.html