简介概要

大数据平台下基于类型的小文件合并方法

来源期刊：软件工程2020年第10期

论文作者：秦加伟刘辉方木云

文章页码：12 - 25

关键词：HDSF;HashMap;索引;合并;缓存;

摘要：Hadoop存储海量小文件将导致存储和计算性能显著下降。本文通过分析HDFS架构提出了一种基于文件类型的小文件合并方法,即根据文件类型将相同类型的小文件合并为大文件,并建立小文件到合并文件的索引关系,索引关系存储于HashMap中。为了进一步提高文件读取速度,建立了基于HashMap的缓存机制。实验表明该方法能显著提高HDFS在存储和读取海量小文件时的整体性能。

详情信息展示

大数据平台下基于类型的小文件合并方法

秦加伟，刘辉，方木云

安徽工业大学计算机科学与技术学院

摘要：Hadoop存储海量小文件将导致存储和计算性能显著下降。本文通过分析HDFS架构提出了一种基于文件类型的小文件合并方法,即根据文件类型将相同类型的小文件合并为大文件,并建立小文件到合并文件的索引关系,索引关系存储于HashMap中。为了进一步提高文件读取速度,建立了基于HashMap的缓存机制。实验表明该方法能显著提高HDFS在存储和读取海量小文件时的整体性能。

关键词：HDSF;HashMap;索引;合并;缓存;

<上一页 1 下一页 >

相关论文

分裂-合并竞争学习的研究

基于可信度的投票列表合并算法

一种潜在支持QoS控制的VC合并方案

社团感知的ICN缓存策略

复合材料B基准值统计的多环境样本合并方法

流动注射合并带法同时测定水样中的钴和铁

石膏矿层合并开采参数确定及稳定性分析

一种基于分裂合并的多边形逼近算法

合并复制技术实现Pocket PC数据同步研究

重型车辆的合并决策及最优控制

相关知识点

泥石流流量合并计算

分开-合并法

矿物浮选泡沫图像区域合并

分开-合并与分开-扩张分割

点云数据格式中的PCD文件

三维模型合并、分解及分割

在.NET平台上利用OLE开发GIS的方法研究

软夹层介质瑞利波频散曲线的合并化

冶金生产过程全流程质量监控系统的数据集成平台

有色金属在线官网 | 会议 | 在线投稿 | 购买纸书 | 科技图书馆

中南大学出版社技术支持版权声明电话：0731-88830515 88830516 传真：0731-88710482 Email:administrator@cnnmol.com

互联网出版许可证：（署）网出证（京）字第342号京ICP备17050991号-6 京公网安备11010802042557号