《大数据全系列》
本次更新内容为大数据第十一阶段和十二阶段:
第十一阶段 CDH集群管理
本阶段所讲的CDH是大数据分布式集群管理工具。CDH由Cloudera公司开发并提供大数据集群的配置标准化,可以帮助企业安装、配置、运行 hadoop 以达到大规模企业数据的处理和分析。目前市场中Cloudera公司开发的Cloudera Manager平台(简称CM)与CDH市场占有率很大,掌握 CM+CDH 集群管理是企业开发中必不可少的技能。
适合人群:
1)掌握Linux、Zookeeper、Hadoop、HDFS、MapReduce原理及使用
2)掌握Hive、HBase原理及使用
第一章 Cloudera Manager 简介及CDH简介 |
01-大数据集群搭建及管理问题 |
02-CDH hadoop 发行版简介及Cloudera Manager 平台简介 |
03-Cloudera Manager平台架构原理及模块分析 |
第二章 Cloudera Manager 安装及CDH安装 |
01_Coludera Manager平台搭建节点角色划分及内存分配 |
02_Coludera Manager平台搭建ip&hostname&防火墙&selinux设置 |
03_Coludera Manager平台搭建本地yum源配置使用 |
04_Coludera Manager平台搭建两两节点之间免密登录配置 |
05_Coludera Manager平台搭建节点时间同步及JDK配置安装 |
06_Coludera Manager平台搭建MySQL安装及安装第三方依赖 |
07_Coludera Manager平台搭建Cloudera Manager 平台安装步骤详解 |
08_Coludera Manager平台搭建Cloudera Manager 平台安装实战操作 |
09_基于Cloudera Manager 平台搭建CDH |
第三章 Cloudera Manager 平台操作使用 |
01_Cloudera Manager 页面状态监控介绍 |
02_Cloudera Manager 页面主页面选项操作 |
03_Cloudera Manager 页面集群设置操作 |
04_Cloudera Manager 页面CMS图表展示及注意问题 |
05_Cloudera Manager HDFS HA 升级操作及测试 |
第四章 hive & hue & impala & oozie使用 |
01_Cloudera Manager 之CDH添加 Hive 服务实操 |
02_Cloudera Manager 之CDH添加 oozie 服务实操 |
03_Cloudera Manager 之CDH添加 hue 服务实操 |
04_Hue UI 系统界面介绍 |
05_Hue UI 系统用户权限操作及HDFS文件系统操作 |
06_Hue UI 系统Hive 表库操作及元数据操作 |
07_Hue UI 系统配置RDBMS数据库及操作 |
08_Impala 数据分析引擎介绍 |
09_Impala 数据分析引擎架构角色介绍 |
10_Cloudera Manager 之CDH添加 Impala 服务实操&Impala优缺点&Impala与Hive异同比较 |
11_Impala 与Hive 查询SQL速度对比及元数据同步测试 |
12_Impala 操作之Impala-Shell命令操作01 |
13_Impala 操作之Impala-Shell命令操作02 |
14_oozie 任务流调度架构原理及web界面展示 |
15_oozie 任务流调度及任务流提交运行 |
16_oozie 任务流依赖关系配置及调度 |
第十二阶段:Kylin 数据仓库分析引擎
本阶段所讲的Apche Kylin 是 Hadoop 大数据平台上的一个开源 OLAP 引擎。它采用多维立方体 Cube 预计算技术,可以将特定场景下的大数据 SQL 查询速度提升到亚秒级别。Kylin也是由中国人主导的Apache顶级开源项目,目前在各大企业中广泛使用。
适合人群:
1)掌握数据仓库建模理论及Hive数据仓库
2)掌握SQL语言及SQL编程
第一章 数据仓库理论基础及OLAP分析瓶颈 |
01_数据分析之OLTP与OLAP操作的区别 |
02_OLAP数据分析之事实表与维度表 |
03_OLAP数据分析之星型模型与雪花模型 |
04_OLAP数据分析特点及分类 |
05_OLAP数据分析操作类型解释 |
06_OLAP数据分析瓶颈问题 |
第二章 Kylin架构原理及实战操作 |
01_Kylin介绍及Kylin架构原理 |
02_Kylin搭建安装要求 |
03_Kylin搭建基础环境准备及Kylin搭建启动 |
04_Kylin 解压目录介绍及Kylin界面介绍 |
05_Kylin 分布式搭建及Kylin配置解释 |
06_Kylin 构建Cube实操之Hive准备事实表及维度表 |
07_Kylin 构建Cube实操之创建Kylin Project及构建Kylin Model |
08_Kylin 构建Cube实操之创建Cube及Cube配置01 |
09_Kylin 构建Cube实操之创建Cube及Cube配置02 |
10_Kylin 构建Cube实操之Kylin构建Cube执行流程及结果查询速度对比 |
11_Kylin 构建Cube实操之Kylin 样例Cube导入及模型介绍 |
12_Kylin 构建Cube实操之Kylin 样例Cube 构建 |
13_Kylin 构建Cube实操之Kylin 样例增量构建Cube及速度测试对比 |
14_Kylin 构建Cube实操之Kylin 样例Cube 合并Segment片段 |
第三章 Kylin 算法及实战操作 |
01_Kylin构建Cube之Layered Cubing 逐层算法 |
02_Kylin构建Cube之Fast Cubing 逐块算法及算法的选择 |
03_Kylin构建Cube之创建Project&Model&Cube实战 |
04_Kylin构建Cube之Kylin SQL 注意问题及JDBC 代码连接Kylin |
05_Kylin构建Cube之Kylin SQL 传参操作 |
另附各章节课程资料