HBase模式设计之ID顺序增长（rowkey顺序增长） - 844604778 - ITeye博客

`

844604778

浏览: 551230 次

最近访客更多访客>>

追逐什么

mist1_

firefly1314

leo-fan

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

全部博客 (1095)

社区版块

存档分类

2013-10 ( 346)
2013-09 ( 185)
2013-08 ( 122)
更多存档...

最新评论

hnu_hgc：求代码，3243544018@qq.com
Android 内存清理

HBase模式设计之ID顺序增长（rowkey顺序增长）

阅读更多

在设计RowKey的时候，常常有应用的RowKey必须包含ID部分，这样才可以支持查询访问。但ID自增长，会导致写入数据的时候压力集中在某一个或少数几个Region上，这是HBase设计的大忌。

经过多个应用的实践，我创造了ID的二进制反转的方式来避免。

简单说明: 比如ID是Byte型(一般为int或者long，此处为方便解释)，RowKey=ID+timestamp，1,2,3,4……这样增长，对应二进制为0000 0001，0000 0010，0000 0011,0000 0100……，因为前面的bit是不会变化的，所以以ID为RowKey（或者ID打头）的数据写入的时候会集中在一个region上，然后又集中在下一个region上。为此将变化的部分放到RowKey的前面，来分散写入的压力。前面的增长在RowKey的ID上就变成1000 0000， 0100 0000， 1100 0000，0010 0000……我们预分区，假如需要16-1个分区，就可以分为[,0x01)，[0x01,0x02),[0x02,0x03)……[0xFE,0xFF), [0xFF,)，注意算一下，这样，1,2,3,4……就会写到不同的区间上，从而分散到不同的region了。（提醒：为什么只拿ID说事，不考虑timestamp呢，因为HBase的RowKey时字节码比较的，先从高位开始，高位分出胜负，后面就不care了~）

优点：转顺序为分散，均衡集群压力；可以做到预分区；不用hash，不用考虑ID的hash碰撞，从而节约存储空间；

限制：scan只能在同一ID打头的rowkey内进行，连续ID的scan不能直接支持，需要程序逻辑处理。

相信了解HBase的能很快理解，不做赘述。以后不断分享HBase设计和系统运营、代码分析、缺陷修复等。

分享到：

浅谈一下Java基础中的break和continue关键 ... | linux下C编程详解

2013-09-24 02:14
浏览 587
评论(0)
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

hbase的Rowkey设计方案.pdf: hbase的Rowkey设计⽅案 1.1 hbase的概述的概述 HBase由于其存储和读写的⾼性能，在OLAP即时分析中越来越发挥重要的作⽤。作为Nosql数据库的⼀员，HBase查询只能通过其 Rowkey来查询(Rowkey⽤来表⽰唯⼀⼀⾏记录)，...

rowkey设计案例.zip: Spark存储数据到HBase实现RowKey完全散列-多进程多线程间Random完全随机，完美解决热点问题

HBase数据库设计.doc: HBase的模式Schema设计的一些概念和原则 5 1）模式的创建与更新 5 2）列族的数量 6 3）行键设计RowKey 6 5. HBase的拓扑结构是什么？ 7 1）拓扑结构 7 2）HBase与ZooKeeper的关系是什么？ 7 3）HBase的内部结构管理...

HBaseRowkey设计要点.pdf: 阿里云吴阳平(明惠) 阿里云HBase业务架构师主要章节：

HBase分页查询的rowkey设计技巧: 用户历史订单列表查询rowkey设计技巧最左前缀原则

HBASE调优 rowkey: HBASE调优 HBASE技术框架与存储模型 v HBASE调优 v 硬件 v 系统参数 v java v 表的设计 v 客户端 v 服务器端

hbase的rowkey设计与hbase的协处理器运用.docx: 该文档是介绍hbase的rowkey设计与hbase的协处理器运用，与大家分享！

HBase-RowKey与索引设计(高清): HBase-RowKey与索引设计(高清) HBase-RowKey与索引设计(高清)HBase-RowKey与索引设计(高清)

大数据性能调优之HBase的RowKey设计.docx: 大数据性能调优之HBase的RowKey设计.docx

Hbase行键设计（rowkey）实现多条件查询: HBASE的使用跟业务逻辑有很强的关联性，就像本文里提到的例子使用ElasticSearch更合适。...本文主要内容是通过合理hbase行键（rowkey)设计实现快速的多条件查询，所采用的方法将所有要用于查询中的列经过一些处理后

HBaseRowkey的散列与预分区设计: HBase中，表会被划分为1...n个Region，被托管在RegionServer中。Region二个重要的属性:StartKey与EndKey表示这个Region维护的rowKey范围，当我们要读/写数据时，如果rowKey落在某个start-endkey范围内，那么就会定位...

大数据开发之案例实践Hbase的设计及企业优化视频教程（视频+讲义+笔记+配置+代码+练习）: │ Hbase表中rowkey及列簇的设计 │ Hbase表设计-微博案例的表设计 │ Hbase表设计-微博案例的业务实现 │ Hbase列簇属性的介绍 │ Hbase性能优化-GC调优 │ Hbase性能优化-内存管理 │ Hbase性能优化-flush、...

hbase数据可视化系统: springboot搭建的hbase可视化界面支持hbase的建表与删除支持根据rowkey查询数据

hbase原理和设计: hbase原理和设计,包括二级索引，rowkey设计,常见的坑.

Hbase 表设计与操作: HBase – Hadoop Database，是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统，利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。 HBase是Google Bigtable的开源实现，类似Google Bigtable...

HBase核心模块介绍及基本概念介绍（HBase模式设计）: 本文主要介绍了HBase与Hadoop之间的关系、HBase的核心功能模块、HBase的使用场景、经典案例及使用场景等。本文来自CSDN，由火龙果软件Linda编辑、推荐。Hadoop框架中的HDFS分布式文件系统为HBase提供了可靠的底层...

2-2+HBase-RowKey+与索引设计.zip: 2-2+HBase-RowKey+与索引设计

大数据书籍-Hbase架构设计（高清）: 这本书对于想学习大数据Hbase的程序爱好者非常有用，深入介绍了从Hbase原理、生态圈到项目中架构设计和相关问题优化的各方面

hbase架构设计基础: hbase架构设计基础

Global site tag (gtag.js) - Google Analytics