本项目是基于Hive的一个数据分析项目,数据来源于阿里天池项目开源出来的数据,更加的贴近于企业的需求。分析了11个指标数据,通过该项目的实战,加深多Hive的理解和使用。
适合人群:
1)掌握Linux操作系统命令及shell编程
2)掌握zookeeper、Hadoop HDFS、MapReduce使用及原理
3)掌握SQL语言及SQL编程
4)掌握Hive基本使用
章节 | 内容 |
---|---|
章节1电商大数据购买行为分析项目 | 1:淘宝项目_需求分析 2:淘宝项目_创建Hive表 3:淘宝项目_加载数据 4:淘宝项目_DataGrip安装激活 5:淘宝项目_配置HiveServer2_ 6:淘宝项目_DataGrip配置 7:淘宝项目_热卖商品Top10一 8:淘宝项目_热卖商品Top10二 9:淘宝项目_Sqoop概述 10:淘宝项目_Sqoop原理剖析 11:淘宝项目_Sqoop安装 12:淘宝项目_SQLyog保姆级安装 13:淘宝项目_Sqoop导出数据到MySQL 14:淘宝项目_Superset概述 15:淘宝项目_安装Python环境 16:淘宝项目_安装配置Superset一 17:淘宝项目_安装配置Superset二 18:淘宝项目_启停Superset 19:淘宝项目_Superset启停脚本 20:淘宝项目_整合MySQL数据源 21:淘宝项目_热卖商品Top10可视化 22:淘宝项目_热卖品牌Top10SQL开发 23:淘宝项目_热卖品牌Top10数据同步 24:淘宝项目_热卖品牌Top10可视化 25:淘宝项目_购物达人Top10SQL开发 26:淘宝项目_购物达人Top10数据同步 27:淘宝项目_购物达人Top10可视化 28:淘宝项目_回购Top50SQL开发 29:淘宝项目_回购Top50数据同步 30:淘宝项目_回购Top50可视化 31:淘宝项目_各年龄段购物数量SQL开发 32:淘宝项目_各年龄段购物数量数据同步 33:淘宝项目_各年龄段购物数量可视化 34:淘宝项目_网购行为与性别关系SQL开发 35:淘宝项目_网购行为与性别关系数据同步 36:淘宝项目_网购行为与性别关系可视化 37:淘宝项目_品牌内热销商品Top3SQL开发一 38:淘宝项目_品牌内热销商品Top3SQL开发二 39:淘宝项目_品牌内热销商品Top3数据同步 40:淘宝项目_品牌内热销商品Top3可视化 41:淘宝项目_购物记录拓宽年月日 42:淘宝项目_购物记录拓宽周数和星期几一 43:购物记录拓宽周数和星期几二 44:淘宝项目_购物记录拓宽数据同步 45:淘宝项目_购物记录拓宽表Dataset配置 46:淘宝项目_集群扩容方案 47:淘宝项目_异常处理方案 48:淘宝项目_年月维度购物趋势可视化 49:淘宝项目_周维度购物趋势可视化 50:淘宝项目_周维度购物趋势可视化 |
另附本章节课程资料