基于HBase数据分类的压缩策略选择方法

TP301.6; 为解决现有的HBase数据压缩策略选择方法未考虑数据的冷热性,以及在选择过程中存在片面性和不可靠性的缺陷,提出了基于HBase数据分类的压缩策略选择方法.依据数据文件的访问频度将HBase数据划分为冷热数据,并限定具体的访问级别;在此基础上增加评估层,综合考虑基于相邻区和统计列的选择方法,提出基于数据访问级别的压缩策略选择方法.仿真实验及结果表明,提出的压缩策略选择方法不仅节省了存储空间,还大大提高了数据查询的性能....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 37; no. 4; pp. 12 - 22
Main Authors 王海艳, 伏彩航
Format Journal Article
LanguageChinese
Published 南京邮电大学江苏省无线传感网高技术研究重点实验室,江苏南京210003 2016
南京邮电大学计算机学院,江苏南京210023
Subjects
Online AccessGet full text

Cover

Loading…
More Information
Summary:TP301.6; 为解决现有的HBase数据压缩策略选择方法未考虑数据的冷热性,以及在选择过程中存在片面性和不可靠性的缺陷,提出了基于HBase数据分类的压缩策略选择方法.依据数据文件的访问频度将HBase数据划分为冷热数据,并限定具体的访问级别;在此基础上增加评估层,综合考虑基于相邻区和统计列的选择方法,提出基于数据访问级别的压缩策略选择方法.仿真实验及结果表明,提出的压缩策略选择方法不仅节省了存储空间,还大大提高了数据查询的性能.
ISSN:1000-436X
DOI:10.11959/j.issn.1000-436x.2016068