《大数据全系列》
本次更新内容为大数据第七阶段:分布式数据库 HBase:
本阶段介绍HBase 是一个分布式的、面向列的分布式数据库,HBase是基于Google 开源的bigtable的实现,面向列的非关系性数据库。在大数据分布式处理中,HBase是必不可少的数据存储“利器”。
适合人群:
1)掌握HDFS 数据存储原理及命令使用
2)掌握zookeeper、Hadoop HDFS、MapReduce使用及原理
第1章 |
01hbase介绍 |
02数据结构和存储结构 |
03hbase架构01 |
04hbase架构02 |
05hbase高可用完全分布式搭建 |
06hbase客户端常用操作 |
07hbase数据模型进阶 |
08LSMTree |
09大合并(major)和小合并(minor) |
10hbase读写流程 |
第2章 |
01创建表phone |
02添加数据和根据rowkey查询一行数据 |
03Scan查询多行数据 |
04为已存在的表添加列族 |
05Delete删除数据 |
06通话记录实战需求分析 |
07创建指定命名空间下的表 |
08创建10个用户10000条通话记录 |
09查询某手机号3月份的全部通话记录 |
10Cell值的添加和删除 |
11查询过滤器介绍 |
12按照电话号码和主被叫类型查询通话记录 |
13用户角色表设计 |
14部门表设计 |
15Google Protocol Buffer介绍 |
16Google Protocol Buffer安装 |
17使用ProtocolBuffer改造insert()方法 |
18使用ProtocolBuffer改造scan()方法 |
19使用ProtocolBuffer将1000条通话记录压缩一条记录 |
第3章 |
01HDFS-TO-HBase思路分析 |
02HDFS-TO-HBase代码实现 |
03将MR输出写入HBase的源码分析 |
04HBase-MR-HBase思路分析和前期准备 |
05HBase-MR-HBase代码实现 |
06HBase-MR-HBase源码分析 |
07HBase-TO_HDFS代码实现 |
08优化之创建表时预置多个region |
09表设计相关优化 |
10写表操作相关优化 |
11读表操作相关优化 |
另附各章节课程资料