本阶段注重机器学习算法原理推导,从零开始讲解每一个复杂的机器学习算法,基于真实数据集进行案例实战!本阶段从线性模型开始讲起,再到由线性模型引申出来的相关算法,帮助大家快速、透彻的理解机器学习算法的原理、推导、实现、优化,并且使用真实数据集进行算法调用,对模型训练、模型评估与选择、模型使用手把手实战。
章节 | 内容 |
---|---|
章节1 机器学习预备知识 | 1:卡方检验 2:卡方检验的statsmodels实现 3:配对卡方检验 4:相关分析概述 5:相关系数的计算原理 6:相关分析的Python实现 7:RR与OR |
章节2 KNN与交叉检验 | 8:KNN基础知识 9:实战_使用KNN完成鸢尾花分类预测 10:交叉验证 11:实战_手写数字图片数据集的调参、分类识别 12:实战_使用网格搜索进行调参 |
章节3 线性回归与梯度下降法 | 13:线性回归基础 14:实战_波士顿房价的线性回归模型 15:实战(一)_能效数据的相关热力图 16:实战(二)_能效数据的线性回归 17:梯度下降法介绍 18:实战_梯度下降法在线性回归中的使用 19:实战_scikit-learn使用SGD实现线性回归 |
章节4 逻辑回归与Softmax回归 | 20:逻辑回归概述 21:实战_逻辑回归解决二分类问题 22:实战_对逻辑回归调整概率阈值 23:Softmax回归简介 24:实战_Softmax回归预测鸢尾花多分类 |
章节5 多项式回归、过拟合、模型正则化 | 25:多项式回归 26:实战_多项式回归结合Pipeline管道机制 27:过拟合与欠拟合 28:模型正则化 29:岭回归与Lasso回归 30:实战_岭回归的sklearn实现 31:实战_LASSO回归的sklearn实现 |
章节6 分类算法的评价 | 32:精准率、召回率、F1 Score 33:实战_sklearn计算精准率、召回率、F1 Score 34:实战_PR曲线及其绘制 35:实战_ROC曲线及其绘制 36:计算ROC_AUC |
章节7 KMeans聚类与降维算法 | 37:KMeans介绍 38:实战_KMeans聚类分析 39:实战_PCA对红酒数据降维并可视化 40:实战_KPCA核主成分分析 41:实战_t-SNE红酒数据降维 |
章节8 决策树与集成学习 | 42:决策树基础 43:基尼指数与CART决策树 44:实战_CART分类树的sklearn实现 45:实战_决策树解决回归问题 46:集成学习的类型 47:Bagging与随机森林 48:实战_随机森林实现分类 49:Adaboost算法原理 50:实战_Adaboost + 决策树 51:Gradient Boosting原理 52:实战_GBDT及其代码实现 53:XGBoost算法原理 54:实战_XGBoost的sklearn实现 |
章节9 SVM与朴素贝叶斯算法 | 55:认识SVM_支持向量机 56:SVM的硬间隔与软间隔 57:实战_SVM对鸢尾花分类 58:实战_SVM解决房价预测回归问题 59:认识朴素贝叶斯 60:朴素贝叶斯的三种方式 61:实战_新闻文本数据分类 62:实战_肿瘤类别的分类 |
章节10 Kaggle竞赛 | 63:Kaggle竞赛介绍 64:特征工程(类别字段处理) 65:特征工程(数值字段处理) 66:特征工程(日期字段处理) 67:特征选择(一) 68:特征选择(二) 69:特征选择(三) 70:赛题介绍_泰坦尼克号幸存乘客 71:泰坦尼克号分析(一) 72:泰坦尼克号分析(二) 73:赛题介绍_Home_Credit_Default _Risk 74:Home_Credit_Default_Risk数据分析(一) 75:Home_Credit_Default_Risk数据分析(二) |
另附本章节课程资料