计算机科学与技术学院欢迎你 |

新闻通知

  • 重要新闻
  • 综合新闻
  • 讲座通知
  • 学生工作
  • 通知公告

光熙论坛(第133期)ARMv8处理器上的不规则矩阵乘法性能分析和优化

来源: 作者:发布时间:2025-06-16阅读:

讲座人:刘虎成 博士生

题目:ARMv8处理器上的不规则矩阵乘法性能分析和优化

时间:2025年6月11日19: 30-20: 00

地点:L1711

讲座内容:

通用矩阵乘法作为高性能计算的基础核心,在科学计算、机器学习等领域具有关键地位。尽管已有大量研究致力于其性能优化,但现有成果呈现显著局限性:研究维度聚焦于规则大矩阵形态(如方形)的计算优化,软硬件协同层面则主要面向x86架构体系。针对现代ARMv8平台下不规则矩阵乘法的高效实现,学术界仍缺乏系统性研究。本研究对通用不规则矩阵内核计算不规则矩阵乘法过程中的性能进行分析,剖析了ARMv8架构下不规则矩阵乘法的性能瓶颈。基于此,我们创新性地提出EPPA算法。该算法的核心技术为1)主动减少L1D缓存竞争和2)减少L1D缓存不命中的代价。实验结果表明,我们的 EPPA 算法在多种不同的计算任务和处理器上均优于现有算法,并能加速实际应用。


× 学术夏令营 招生信息