Hbase Release怎么使用
更新:HHH   时间:2023-1-7


这篇文章主要介绍“Hbase Release怎么使用”,在日常操作中,相信很多人在Hbase Release怎么使用问题上存在疑惑,小编查阅了各式资料,整理出简单好用的操作方法,希望对大家解答”Hbase Release怎么使用”的疑惑有所帮助!接下来,请跟着小编一起来学习吧!

1 : 下载:

        Hbase Releases

2:当前我们的稳定的版本为:The 0.98.x series

 下载界面如下:

 选择Stable稳定的版本,进行下载:

  

由于目前 hbase和hadoo的2个重大的分支关系,需要版本之间的匹配。

而 hadoop本身目前已经更新到了最新的hadoop 第二代。

 典型的下载地址如下:

 http://mirrors.cnnic.cn/apache/hadoop/common/stable/

  

  目前选择的hadoop2的版本为 hadoop-2.5.1.tar.gz

   目前安装的为社区版本的 hadoop2 + hbase0.98 版。 如果你想安装CHD CLouder 版本的 hadoop +hbase,请参考另外的博文,CDH hadoop系列

  在最新的Hbase版本之中,引入了如下的新特性:

性能相关

读缓存改进: HDFS 将图片和checksum存储在不同的block中的,所以每次我们进行读操作,都需要进行两次磁盘操作(一次读数据文件,一次读checksum所在的文件)。在 HBASE-5074 这个提案中,提出了将checksum存到block 缓存中的想法。在0.94 版本中,这一特性已经是默认开启的了。

读文件优化: 在0.94 版本之前,如果一个column family对应了多个StoreFile,那么HBase 会从各个StoreFile中读取数据进行合并,即使我们需要的数据在最近的数据文件中存在,也会进行这样的操作。在 HBASE-4465 这个提案中提出了一个叫Lazy Seek的优化,通过先在最近的StoreFile中先读取数据,再看其它StoreFile是否在这个数据操作时间后有操作,如果没有,就不对这个StoreFile进行读取了。这大大减少了对StoreFile的读操作,这一特性也已经是默认开启了。

WAL文件优化: WAL是Write Ahead Log的意思,HBase在每次写操作都会先写WAL文件,通常WAL文件的写入速度直接影响到HBase的整体数据吞吐。而且WAL文件还会根据配置同步到多个数据节点上。在提案 HBASE-4608 中,提到了对Hlog数据进行压缩的想法,同步后的日志文件更小,能够更快地在数据节点间的同步,从而实现更高的数据吞吐。目前这一优化也是默认开启。

新特性

急求箱工具增强: 对原来的HBck工具进行了增强,提供了对孤儿region、region空洞、重叠region的修复。见提案 HBASE-5128: “Uber hbck”。

简化Region Size设置: 通常我们要设置一个region size是很难的,需要考虑很多其它因素。在0.94版本中,按提案 HBASE-4365 的方法,通过动态算法对region size进行制定。

更完整的事务支持: 之前Hbase提供行级的事务,不过每次事务只能执行一个写操作,比如连续地执行一系列Put,Delete操作,那么这些操作是单独一个个的事务,其整体并不是原子性执行的。而在0.94版本中,可以实现Put、Delete在同一个事务中一起原子性执行。见提案 HBASE-3584。

实际上上面不过是一些比较大的改进,这一版本共做了140个功能增强,修复了180个bug。在你的安装包,或则官方的发行记录中。

到此,关于“Hbase Release怎么使用”的学习就结束了,希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习,快去试试吧!若想继续学习更多相关知识,请继续关注天达云网站,小编会继续努力为大家带来更多实用的文章!

返回云计算教程...