CPU-GPU系统中基于剖分的全局性能优化方法
【作者】
张保
;
董小社
;
白秀秀
;
曹海军
;
刘超
;
梅一多
【关键词】
CPU-GPU异构并行系统
全局优化
3级优化
3级剖分
【摘要】针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右.
上一篇:并行片上网络仿真器ParaNSim的设计及性能分析
下一篇:考虑瞬时停车延误的信号灯闭环控制策略研究