TY -的A2 Fraguela巴西利奥b . AU -李,Kyong-Ha AU -康,吸引林盟- Suh Young-Kyoon PY - 2018 DA - 2018/12/02 TI -提高I / O效率Hadoop-Based大规模数据分析程序中SP - 2682085六世- 2018 AB - Apache Hadoop是一个受欢迎的时代大数据的并行处理工具。虽然从业者改写许多传统分析算法让他们定制的Hadoop,低效的I / O问题Hadoop-based项目一再在文献中报道。在本文中,我们解决问题的I / O效率低下Hadoop-based大规模数据分析通过引入我们的Hadoop的有效修改。我们首先把一个柱状的数据布局与传统的Hadoop框架,没有任何修改的Hadoop内部。我们还提供Hadoop与索引能够节省大量的I / O处理不仅选择时星形联结查询谓词也经常使用在许多分析任务。SN - 1058 - 9244 UR - https://doi.org/10.1155/2018/2682085 - 10.1155 / 2018/2682085摩根富林明科学编程PB - Hindawi KW - ER