TI -实现和评估一个异构的,可扩展的,三对角线性系统解算器与OpenCL到目标fpga, gpu, fpga, fpga对角占优三对角线性系统的AB -求解是科学高性能计算(HPC)中常见的问题。此外,HPC平台使用异构计算设备的组合也变得越来越普遍。虽然设计更快的并行线性系统求解器是可取的,但对功耗的关注越来越优先。这项工作展示了 oclspkt例行公事。的 oclspkt例程是截短SPIKE算法的异构OpenCL实现,可以使用fpga、gpu和cpu并行加速对角线占主导地位的三对角线性系统的求解。该例程旨在解决任何大小的三对角系统,并可以根据加速器的计算性能,动态地将优化的工作负载分配给异构环境中的每个加速器。截断的SPIKE FPGA求解器首先被开发用于优化OpenCL设备内核性能、全局内存带宽和交错主机到设备内存事务。FPGA OpenCL内核代码随后被重构和优化,以最佳地利用CPU和GPU的底层架构。我们还开发了一个优化的TDMA OpenCL内核,作为并行截尾SPIKE内核的串行基线性能比较,因为在开发时还没有能够解决大型三对角系统的FPGA三对角求解器。独立的GPU、CPU和FPGA解决方案 oclspkt例程比可比的设备优化的第三方解决方案和适用基线分别快110%、150%和170%。在评估计算设备的异构组合时,发现GPU + FPGA组合具有最佳的计算性能,而仅FPGA配置具有最佳的总体估计能源效率。SN - 1687-7195 UR - https://doi.org/10.1155/2019/3679839 DO - 10.1155/2019/3679839 JF -国际可重构计算杂志PB - Hindawi KW - ER -