《Python全系列》
第六阶段:Linux 环境编程基础
章节5:CentOS6 vs CentOS6
01-Linux_CentOS6与CentOS7的区别1
02-Linux_CentOS6与CentOS7的区别2
03-Centos安全配置-基础设置
04-Centos安全设置-用户登录
05-Centos安全设置-密码设置
06-Centos安全设置-防火墙
第十五阶段:人工智能基础_机器学习理论和实战
章节11:决策树算法
60-决策树的介绍
61-决策树的特点
62-决策树的两种数学表达
63-决策树的构建流程和数学表达
64-决策树分裂常用指标_gini系数介绍
65-Gini系数公式计算Iris分裂点收益
66-信息增益ID3
67-Gini系数和信息熵的关系
68-信息增益率和MSE
69-剪枝-决策树的优缺点
70-ID3和C4.5比较
71-绘制决策树模型的graphvis安装
72-代码决策树鸢尾花分类_绘图_特征选择
73-代码决策树鸢尾花超参数比较
74-代码回归树
章节12:随机森林算法
75-集成学习_随机森林思路
76-Bagging_Boosting
77-随机森林的特征
78-随机森林优缺点_代码调用
79-OOB作为验证集
章节13:Adaboost算法
80-举例判别苹果理解Adaboost
81-什么adaboost_数据的权重_权重错误率
82-Adaboost通过调整数据的权重达到0.5来训练下一个弱分类器
83-Adaboost中每一时刻样本Un如何计算
84-Adaboost的总结
85-PpenCV中CascadeClassifier默认就是用的Adaboost
86-Adaboost在sklearn中的调用
章节14:GBDT算法
87-GBDT是应用函数空间的梯度下降
88-为什么总说GBDT是去拟合的残差
89-再次对比GBDT的梯度下降和之前W的梯度下降
90-距离并且初步总结GBDT
91-GBDT中的shrinkage衰减系数的作用
92-推导GBDT做分类的时候负梯度亦是残差
93-剖析GBDT做二分类的模型使用和训练过程
94-GBDT每条脚本都会求对应的负梯度
95-GBDT做多分类的思路
96-举个例子说明GBDT多分类
97-GBDT副产品_特征组合用于降维
98-再次结合例子对GBDT多分类的具体训练流程剖析
章节15:XGboost算法
99-讲解XGBOOST之前回顾有监督机器学习
100-讲解XGBOOST之前回顾目标式的基于决策树的集成学习
101-讲解XGBOOST目标函数_里面包含了正则项
102-讲解XGBOOST目标函数_本质使用泰勒展开二阶去逼近
103-简化XGBOOST目标函数_引入了gi_hi这两个符号
104-换一种方式表达一棵树
105-把复杂度部分带入XGBOOST目标函数并简化
106-XGBOOST的最终目标函数形式和叶子节点上分值的形式
107-回顾推导出来的W和Obj公式的作用
108-在训练下一颗树的时候已经会根据上一时刻整体的结果来去计算每个样本的g和h
109-具体根据收益公式来去贪婪的生长出每一颗决策树
110-后续关于计算的优化_离散变量_剪枝
111-总结了xgboost流程_对样本自身带权重值xgboost如何解决
112-总结xgboost需要理解的一些点
113-xgboost和GBDT区别
114-关于xgboost的安装
115-对数据集预处理做前期准备
116-对数据集预处理_去掉数值种类非常多的city字段_出生日期转换为年龄_空值太多把维度变成01编码
117-对数据集预处理_填充其它的空值_对某些维度连续性数据的离散化
118-字符串的数值化_离散型数据one-hot编码_重新分为训练和测试_落地保存
119-读取处理好的数据_给定一些xgboost需要的超参数
120-调用xgboost来训练模型_可以选择去使用CV交叉验证得到合适的超参数
121-调整xgboost一些超参数来提升模型的ACC和AUC
章节16:Kaggle实战
122-Rossmann药店销量预测_kaggle的介绍
123-对数据字段的介绍_导包
124-自定义损失函数
125-对数据里面的目标变量sales的一个分析
126-数据的预处理
127-模型的训练_评估
128-kaggle竞赛网站学习
129-Kaggle网页分类竞赛介绍
130-评估指标ROC和AUC
131-评估指标ROC和AUC
132-竞赛其他相关提交成绩排行榜
133-数据导入
134-MLlib对网页分类竞赛数据预处理
135-MLlib对网页分类竞赛数据预处理_模型训练
136-MLlib对网页分类竞赛模型训练_模型训练评估_搜索最佳超参数
137-使用SparkML对网页分类竞赛数据预处理_模型训练_交叉验证调参_01
138-使用SparkML对网页分类竞赛数据预处理_模型训练_交叉验证调参_02
139-使用SparkML对网页分类竞赛数据预处理_模型训练_交叉验证调参_03
140-使用SparkML对网页分类竞赛数据预处理_模型训练_交叉验证调参_04