TY -的A2 Fraguela巴西利奥b . AU - Tran Nhat-Phuong AU -李,Myungho盟——香港,Sugwon PY - 2017 DA - 2017/01/16 TI -性能优化的三维晶格玻尔兹曼流求解器在GPU SP - 1205892六世- 2017 AB -晶格玻尔兹曼方法(加快)是一个强大的流体流动的数值模拟方法。其数据并行特性,它是一种很有前途的候选人为GPU的并行实现。加快,然而,严重的数据密集型和内存限制。特别是,将数据移动到相邻的细胞流式计算阶段带来很多uncoalesced访问在GPU上影响总体性能。此外,加快的主要计算内核使用大量的寄存器每线程这限制了可用的线程并行运行时由于固定数量的寄存器在GPU上。在本文中,我们开发高性能并行化加快的GPU通过最小化与uncoalesced内存访问相关的管理费用,同时提高缓存位置使用瓷砖与数据优化布局的变化。此外,我们积极地减少登记用途加快内核为了增加运行时线程并行性。Nvidia Tesla甘蓝型GPU上实验结果表明我们的方法提供了令人印象深刻的吞吐量性能:每秒12.1063亿点阵更新(MLUPS)。SN - 1058 - 9244 UR - https://doi.org/10.1155/2017/1205892 - 10.1155 / 2017/1205892摩根富林明科学编程PB - Hindawi KW - ER