课程试听
正在播放

阶段一 人工智能

展开
第一章 机器学习概述V2.1
1-1 机器学习介绍
  • 01-0前置-机器学习科学计算库内容简介
  • 01-1讲解-机器学习科学计算库内容简介
  • 02-1讲解-人工智能概述
  • 02-2点评-人工智能概述
  • 03-1讲解-人工智能的发展历程
  • 04-1讲解-人工智能主要分支
  • 04-2点评-人工智能主要分支
  • 05-1讲解-机器学习定义工作流程概述
  • 05-2点评-机器学习定义工作流程概述
  • 06-1讲解-机器学习工作流程各步骤解释
  • 06-2点评-机器学习工作流程各步骤解释
  • 06-3点评-机器学习工作流程各步骤解释
  • 07-1讲解-机器学习算法分类介绍
  • 07-2点评-机器学习算法分类介绍
  • 08-1讲解-模型评估
  • 08-2点评-模型评估
  • 08-3点评-模型评估
  • 09-1讲解-Azure机器学习平台实验演示1
  • 10-1讲解-Azure机器学习平台实验演示2
  • 11-1讲解-深度学习简介
  • 11-2点评-深度学习简介
第二章 环境安装和使用V2.1
2-1 环境安装及使用
  • 12-1讲解-基础环境安装
  • 13-1讲解-jupyter notebook的基本使用1
  • 13-2点评-jupyter notebook的基本使用1
  • 14-1讲解-jupyter notebook的基本使用2
  • 14-2点评-jupyter notebook的基本使用2
  • 15-1讲解-matplotlib的基本使用
第三章 matplotlibV2.1
3-1 matplotlib使用
  • 01-1讲解-实现基础绘图-某城市温度变换图
  • 01-2点评-实现基础绘图-某城市温度变换图
  • 02-1讲解-绘图辅助功能完善-某城市温度变换图
  • 02-2点评-绘图辅助功能完善-某城市温度变换图
  • 03-1讲解-在一个坐标系下绘制多个图像
  • 03-2点评-在一个坐标系下绘制多个图像
  • 04-1讲解-在多个坐标系下绘制多个图像
  • 04-2点评-在多个坐标系下绘制多个图像
  • 05-1讲解-常见图形绘制
  • 05-2点评-常见图形绘制
第四章 numpyV2.1
4-1 numpy使用
  • 06-1讲解-numpy介绍
  • 06-2点评-numpy介绍
  • 07-1讲解-ndarray介绍
  • 07-2点评-ndarray介绍
  • 08-1讲解-创建0,1数组,固定范围数组
  • 08-2点评-创建0,1数组,固定范围数组
  • 09-1讲解-创建随机数组
  • 09-2点评-创建随机数组
  • 10-1讲解-数组的基本操作
  • 10-2点评-数组的基本操作
  • 10-3点评-前面总结
  • 10-4点评-回顾
  • 11-1讲解-ndarray的运算
  • 12-1讲解-数组间运算
  • 11-2点评-ndarray的运算
  • 12-2点评-数组间运算
  • 13-1讲解-矩阵复习
  • 13-2点评-矩阵复习
  • 13-3点评-矩阵复习
第五章 pandasV2.1
5-1 pandas数据结构
  • 14-1讲解-pandas介绍
  • 14-2点评-pandas介绍
  • 15-1讲解-pandas数据结构-series
  • 15-2点评-pandas数据结构-series
  • 16-1讲解-pandas数据结构-DataFrame1
  • 16-2点评-pandas数据结构-DataFrame1
  • 16-3点评-回顾总结
  • 17-1讲解-pandas数据结构-DataFrame2
  • 18-1讲解-pandas数据结构-multiindex和panel
  • 18-2点评-pandas数据结构-multiindex和panel
5-2 pandas基础使用
  • 01-1讲解-pandas中的索引
  • 01-2点评-pandas中的索引
  • 02-1讲解-赋值和排序
  • 02-2点评-赋值和排序
  • 03-1讲解-pandas中的算术运算和逻辑运算
  • 03-2点评-pandas中的算术运算和逻辑运算
  • 04-1讲解-pandas中的统计函数
  • 04-2点评-pandas中的统计函数
  • 05-1讲解-pandas中的累计统计函数和自定义函数
  • 05-2点评-pandas中的累计统计函数和自定义函数
  • 06-1讲解-pandas中绘图方式介绍
  • 07-1讲解-pandas中文件的读取和写入
  • 07-2点评-pandas中文件的读取和写入
  • 07-3点评-pandas中文件的读取和写入
  • 07-4点评-内容总结
5-3 pandas高级使用
  • 08-1讲解-缺失值的处理
  • 08-2点评-缺失值的处理
  • 09-1讲解-数据离散化
  • 09-2点评-数据离散化
  • 10-1讲解-数据表的合并
  • 10-2点评-数据表的合并
  • 11-1讲解-交叉表和透视表介绍
  • 11-2点评-交叉表和透视表介绍
  • 11-3点评-内容回顾
  • 12-1讲解-分组聚合介绍
  • 12-2点评-分组聚合介绍
  • 13-1讲解-星巴克案例实现
  • 13-2点评-星巴克案例实现
5-4 电影案例分析
  • 14-0前置-电影案例分析1
  • 14-1讲解-电影案例分析1
  • 14-2点评-电影案例分析1
  • 15-1讲解-电影案例分析
  • 15-2点评-电影案例分析
  • 15-3点评-电影案例分析
第六章 seabornV2.1
6-1 绘制统计图
  • 01-1讲解-绘制单变量分布
  • 01-2点评-绘制单变量分布
  • 02-1讲解-绘制双变量分布图形
  • 02-2点评-绘制双变量分布图形
6-2 分类数据绘图
  • 03-1讲解-类别散点图的绘制
  • 03-2点评-类别散点图的绘制
  • 03-3点评-内容回顾
  • 04-1讲解-类别内的数据分布和统计估计
  • 04-2点评-类别内的数据分布和统计估计
6-3 NBA案例
  • 05-1讲解-NBA数据获取和相关性基本分析
  • 05-2点评-NBA数据获取和相关性基本分析
  • 06-1讲解-对数据进行分析-seaborn
  • 06-2点评-对数据进行分析-seaborn
  • 07-1讲解-衍生变量的可视化实践
  • 07-2点评-衍生变量的可视化实践
  • 08-1讲解-球队数据分析
  • 08-2点评-球队数据分析
6-4 北京租房数据统计分析
  • 09-0前置-北京市租房数据获取和重复值与空值处理
  • 09-1讲解-北京市租房数据获取和重复值与空值处理
  • 09-2点评-北京市租房数据获取和重复值与空值处理
  • 10-1讲解-数据类型转换(面积,户型)
  • 10-2点评-数据类型转换(面积,户型)
  • 11-1讲解-房源数量和位置分布分析
  • 11-2点评-房源数量和位置分布分析
  • 12-1讲解-户型数量基本分析
  • 12-2点评-户型数量基本分析
  • 12-3点评-户型数量基本分析
  • 13-1讲解-平均租金基本分析
  • 13-2点评-平均租金基本分析
  • 14-1讲解-面积区间分析
  • 14-2点评-面积区间分析
  • 14-3点评-内容总结
第七章 K近邻算法V2.1
7-1 k近邻算法介绍
  • 01-0前置-K-近邻算法简介
  • 01-1讲解-K-近邻算法简介
  • 01-2点评-K-近邻算法简介
  • 02-1讲解-K近邻算法api初步使用
  • 02-2点评-K近邻算法api初步使用
  • 03-1讲解-机器学习中距离度量介绍
  • 03-2点评-机器学习中距离度量介绍
  • 04-1讲解-K值的选择介绍
  • 04-2点评-K值的选择介绍
7-2 kd树
  • 05-1讲解-kd树和kd树的构造过程
  • 05-2点评-kd树和kd树的构造过程
  • 06-1讲解-kd树案例实现
  • 06-2点评-kd树案例实现
  • 06-3点评-内容回顾
  • 06-4点评-kd树案例实现
7-3 数据集处理
  • 07-1讲解-数据集获取和属性介绍
  • 07-2点评-数据集获取和属性介绍
  • 08-1讲解-数据可视化介绍
  • 08-2讲解-数据可视化介绍
  • 09-1讲解-数据集的划分
  • 09-2点评-数据集的划分
7-4 特征工程
  • 10-1讲解-特征预处理简介
  • 10-2点评-特征预处理简介
  • 11-1讲解-归一化和标准化介绍
  • 11-2点评-归一化和标准化介绍
  • 11-3点评-归一化和标准化介绍
7-5 KNN总结
  • 12-1讲解-鸢尾花种类预测
  • 12-2点评-鸢尾花种类预测
  • 12-3点评-内容总结
  • 12-4点评-内容回顾
  • 13-1讲解-KNN算法总结
  • 13-2点评-KNN算法总结
7-6 交叉验证, 网格搜索
  • 14-1讲解-交叉验证、网格搜索概念介绍
  • 14-2点评-交叉验证、网格搜索概念介绍
  • 15-1讲解-交叉验证、网格搜索案例实现
  • 15-2点评-交叉验证、网格搜索案例实现
7-7 案例 Facebook位置预测
  • 01-1讲解-案例-Facebook位置预测流程分析
  • 01-2点评-案例-Facebook位置预测流程分析
  • 02-1讲解-案例-Facebook位置预测代码实现1
  • 02-2点评-案例-Facebook位置预测代码实现1
  • 03-1讲解-案例-Facebook位置预测代码实现2
  • 03-3点评-案例-Facebook位置预测代码实现2
  • 04-1讲解-补充-数据分割和留出法
  • 04-2点评-补充-数据分割和留出法
  • 05-1讲解-补充-交叉验证法和自助法
  • 05-2点评-补充-交叉验证法和自助法
第八章 线性回归V2.1
8-1 回归介绍
  • 06-1讲解-线性回归简介
  • 06-2点评-线性回归简介
  • 07-1讲解-初始线性回归api
  • 08-1讲解-数学:求导
  • 08-2点评-数学:求导
8-2 损失优化
  • 09-1讲解-线性回归中损失函数的介绍
  • 09-2点评-线性回归中损失函数的介绍
  • 10-1讲解-使用正规方程对损失函数进行优化
  • 10-2点评-使用正规方程对损失函数进行优化
  • 11-1讲解-使用梯度下降法对损失函数进行优化
  • 11-2点评-使用梯度下降法对损失函数进行优化
8-3 回归相关知识
  • 12-1讲解-梯度下降法方法介绍
  • 12-2点评-梯度下降法方法介绍
  • 12-3点评-内容回顾
  • 13-0前置-线性回归api再介绍
  • 13-1讲解-线性回归api再介绍
  • 13-2点评-线性回归api再介绍
  • 14-1讲解-波士顿房价预测案例
  • 14-2点评-波士顿房价预测案例
  • 15-1讲解-欠拟合和过拟合的介绍
  • 15-2点评-欠拟合和过拟合的介绍
  • 16-1讲解-正则化线性模型
  • 16-2点评-正则化线性模型
  • 17-1讲解-岭回归介绍
  • 17-2点评-岭回归介绍
  • 18-1讲解-模型保存和加载
  • 18-2点评-模型保存和加载
第九章 逻辑回归V2.1
9-1 逻辑回归
  • 01-1讲解-逻辑回归介绍
  • 01-2点评-逻辑回归介绍
  • 02-1讲解-逻辑回归api介绍
  • 02-2点评-内容回顾
  • 03-1讲解-肿瘤预测案例
  • 03-2点评-肿瘤预测案例
  • 04-1讲解-分类评估方法介绍
  • 04-2点评-分类评估方法介绍
  • 05-1讲解-roc曲线绘制过程
  • 05-2点评-roc曲线绘制过程
  • 05-3点评-roc曲线绘制过程
  • 06-1讲解-补充-类别不平衡数据介绍
  • 06-2点评-补充-类别不平衡数据介绍
  • 07-1讲解-补充-过采样和欠采样介绍
  • 07-2点评-补充-过采样和欠采样介绍
第十章 决策树V2.1
10-1 信息增益
  • 08-1讲解-决策树算法简介
  • 09-1讲解-熵的介绍
  • 09-2点评-熵的介绍
  • 09-3点评-内容回顾
  • 09-3点评-熵的介绍
  • 10-0前置-信息增益的介绍
  • 10-1讲解-信息增益的介绍
  • 10-2点评-信息增益的介绍
  • 11-1讲解-信息增益率的介绍
  • 11-2点评-信息增益率的介绍
  • 12-1讲解-基尼指数的介绍
  • 12-2点评-基尼指数的介绍
  • 13-1讲解-决策树划分原理小结
  • 13-2点评-决策树划分原理小结
  • 14-1讲解-cart剪枝介绍
  • 14-2点评-cart剪枝介绍
10-2 特征提取
  • 15-1讲解-字典特征提取
  • 15-2点评-字典特征提取
  • 16-1讲解-英文文本特征提取
  • 16-2点评-英文文本特征提取
  • 17-1讲解-中文文本特征提取
  • 17-2点评-中文文本特征提取
  • 18-1讲解-tfidf内容讲解
  • 18-2点评-tfidf内容讲解
  • 18-3点评-tfidf内容讲解
10-3 案例:泰坦生存预测
  • 01-1讲解-决策树算法api介绍
  • 01-2点评-决策树算法api介绍
  • 02-1讲解-泰坦尼克号乘客生存预测
  • 02-2点评-泰坦尼克号乘客生存预测
  • 03-1讲解-树木可视化操作
  • 03-2点评-树木可视化操作
10-4 回归决策树
  • 04-1讲解-回归决策树介绍
  • 04-2点评-回归决策树介绍
  • 05-1讲解-回归决策树和线性回归对比
  • 05-2点评-回归决策树和线性回归对比
第十一章 集成学习V2.1
11-1 集成介绍
  • 06-1讲解-集成学习基本介绍
  • 07-1讲解-bagging和随机森林
  • 07-2点评-bagging和随机森林
  • 07-3点评-bagging和随机森林
  • 07-4点评-内容回顾
11-2 随机森林案例
  • 08-1讲解-otto案例介绍以及数据获取
  • 08-2点评-otto案例介绍以及数据获取
  • 09-1讲解-otto数据基本处理
  • 09-2点评-otto数据基本处理
  • 10-1讲解-otto数据模型基本训练
  • 10-2点评-otto数据模型基本训练
  • 11-1讲解-模型调优和确定最优模型
  • 11-2点评-模型调优和确定最优模型
  • 11-3点评-模型调优和确定最优模型
  • 12-1讲解-生成提交数据
  • 12-2点评-生成提交数据
11-3 集成学习
  • 13-1讲解-boosting介绍
  • 13-2点评-boosting介绍
  • 14-1讲解-GBDT的介绍
  • 14-2点评-GBDT的介绍
第十二章 聚类算法V2.1
12-1 聚类算法
  • 01-1讲解-聚类算法介绍
  • 02-1讲解-聚类算法api初步实现
  • 02-2点评-聚类算法api初步实现
  • 03-1讲解-聚类算法实现流程
  • 03-2点评-聚类算法实现流程
  • 04-1讲解-模型评估
  • 04-2点评-模型评估
  • 05-1讲解-算法优化介绍
  • 05-2点评-算法优化介绍
  • 06-1讲解-特征降维内容介绍
  • 06-2点评-特征降维内容介绍
  • 07-1讲解-pca降维介绍
  • 08-1讲解-用户对物品类别的喜好细分案例
  • 08-2点评-用户对物品类别的喜好细分案例
第十三章 朴素贝叶斯V2.1
13-1 朴素贝叶斯
  • 09-1讲解-初始朴素贝叶斯
  • 09-2点评-初始朴素贝叶斯
  • 10-1讲解-概率内容复习
  • 10-2点评-概率内容复习
  • 11-1讲解-朴素贝叶斯计算案例
  • 11-2点评-朴素贝叶斯计算案例
  • 12-1讲解-朴素贝叶斯案例实现1
  • 13-1讲解-朴素贝叶斯案例实现2
  • 13-2点评-朴素贝叶斯案例实现2
  • 13-3点评-内容回顾
  • 13-4点评-内容回顾
  • 14-1讲解-朴素贝叶斯内容总结
  • 14-2点评-朴素贝叶斯内容总结
第十四章 SVM算法V2.1
14-1 SVM算法
  • 01-1讲解-SVM基本介绍
  • 01-2点评-SVM基本介绍
  • 02-1讲解-SVM算法api初步使用
  • 03-1讲解-SVM算法推导的目标函数
  • 03-2点评-SVM算法推导的目标函数
  • 04-1讲解-SVM目标函数推导过程及举例
  • 04-2点评-SVM目标函数推导过程及举例
  • 04-3点评-内容回顾
  • 05-1讲解-SVM损失函数
  • 05-2点评-SVM损失函数
  • 06-1讲解-SVM的核方法介绍
  • 06-2点评-SVM的核方法介绍
  • 07-1讲解-SVM回归介绍
  • 07-2点评-SVM回归介绍
  • 08-1讲解-SVM算法api再介绍
  • 08-2点评-SVM算法api再介绍
  • 09-1讲解-数字识别器案例初步介绍
  • 09-2点评-数字识别器案例初步介绍
  • 10-1讲解-数字识别器-获取数据
  • 10-2点评-数字识别器-获取数据
  • 11-1讲解-数字识别器-数据基本处理和模型训练
  • 11-2点评-数字识别器-数据基本处理和模型训练
  • 12-1讲解-SVM总结
  • 12-2点评-SVM总结
  • 12-3点评-内容总结
第十五章 EM算法V2.1
15-1 EM算法
  • 01-1讲解-初识EM算法
  • 01-2点评-初识EM算法
  • 02-1讲解-EM算法介绍
  • 02-2点评-EM算法介绍
  • 02-3点评-内容回顾
  • 03-0前置-EM算法实例
  • 03-1讲解-EM算法实例
  • 03-2点评-EM算法实例
第十六章 HMM算法V2.1
16-1 HMM算法
  • 04-1讲解-马尔科夫链的介绍
  • 04-2点评-马尔科夫链的介绍
  • 05-1讲解-HMM模型的简单案例
  • 05-2点评-HMM模型的简单案例
  • 06-1讲解-HMM模型三种经典问题举例求解
  • 06-2点评-HMM模型三种经典问题举例求解
  • 07-1讲解-HMM模型基础
  • 07-2点评-HMM模型基础
  • 08-1讲解-前向后向算法评估观察序列概率
  • 08-2点评-前向后向算法评估观察序列概率
  • 08-3点评-内容回顾
  • 08-4点评-前向后向算法评估观察序列概率
  • 09-1讲解-维特比算法解码隐藏状态序列
  • 09-2点评-维特比算法解码隐藏状态序列
  • 10-1讲解-鲍姆-韦尔奇算法简介
  • 11-1讲解-HMM模型api介绍及案例代码实现
  • 11-2点评-HMM模型api介绍及案例代码实现
第十七章 集成学习进阶V2.1
17-1 XGBoost算法
  • 01-1讲解-xgboost最优模型构建方法
  • 01-2点评-xgboost最优模型构建方法
  • 02-1讲解-目标函数确定和树的复杂度介绍
  • 02-2点评-目标函数确定和树的复杂度介绍
  • 03-1讲解-XGBoost目标函数的推导
  • 03-2点评-回顾
  • 03-2点评-XGBoost目标函数的推导
  • 04-1讲解-XGBoost的回归树构建方法
  • 04-2点评-XGBoost的回归树构建方法
  • 05-1讲解-XGBoost和GBDT的区别
  • 05-2点评-XGBoost和GBDT的区别
  • 06-1讲解-xgboost算法api与参数介绍
  • 06-2点评-xgboost算法api与参数介绍
  • 07-1讲解-xgboost简单案例介绍
17-2 otto案例
  • 08-1讲解-otto案例xgboost实现-数据基本处理
  • 08-2点评-otto案例xgboost实现-数据基本处理
  • 08-3点评-otto案例xgboost实现-数据基本处理
  • 09-1讲解-otto案例xgboost实现-模型基本训练
  • 10-1讲解-otto案例xgboost实现-模型调优
  • 10-2点评-otto案例xgboost实现-模型调优
  • 10-3点评-内容回顾
  • 11-1讲解-otto案例xgboost实现-最优模型运行
17-3 lightGBM算法
  • 01-1讲解-lightGBM简单介绍
  • 01-2点评-lightGBM简单介绍
  • 02-1讲解-lightGBM算法原理介绍
  • 02-2点评-lightGBM算法原理介绍
  • 03-1讲解-lightGBM算法api参数介绍
  • 03-2点评-lightGBM算法api参数介绍
  • 04-1讲解-lightGBM算法简单案例介绍
  • 04-2点评-lightGBM算法简单案例介绍
  • 05-1讲解-pubg案例简介
  • 05-2点评-pubg案例简介
17-4 绝地求生案例
  • 06-1讲解-获取pubg数据
  • 06-2点评-获取pubg数据
  • 07-1讲解-数据缺失值处理和查看每场比赛人数
  • 07-2点评-数据缺失值处理和查看每场比赛人数
  • 07-3点评-内容回顾
  • 08-1讲解-规范化输出部分数据和部分变量合成
  • 09-1讲解-异常值处理1
  • 09-2点评-异常值处理1
  • 10-1讲解-异常值值处理2
  • 10-2点评-异常值值处理2
  • 11-1讲解-类别型数据处理
  • 11-2点评-类别型数据处理
  • 12-1讲解-数据截取、确定特征值和目标值、分割数据集
  • 13-1讲解-使用RF进行模型训练
  • 13-2点评-使用RF进行模型训练
  • 14-1讲解-lightGBM对模型调优1
  • 14-2点评-lightGBM对模型调优1
  • 15-1讲解-lightGBM对模型调优2
  • 15-2点评-lightGBM对模型调优2

阶段二 数据挖掘

展开
第一章 SparkMllib数据挖掘+SparkGraphX
1-1 1-SparkMllib机器学习理论基础详解
  • 01-机器学习和大数据的区别(一)
  • 02-机器学习和大数据的区别和联系(二)
  • 03-机器学习和大数据的区别和联系(三)
  • 04-人工智能和机器学习的区别
  • 05-数据分析和数据挖掘联系
  • 06-什么是机器学习问题
  • 07-基于规则的学习和基于模型的学习方式
  • 08-机器学习数据集概述1
  • 09-机器学习数据集概述2
  • 10-机器学习数据集概述3
  • 11-机器学习问题分类
  • 12-机器学习三要素强化
  • 13-构建机器学习模型的流程
  • 14-模型选择
  • 15-交叉验证及经验和结构风险
1-2 2-SparkMllib库特征工程基础与实战(一)
  • 01-SparkMllib的功能
  • 2-SparkMllib的版本
  • 3-SparkMllib架构
  • 4-环境搭建及RDD、DF、DS的转换实践
  • 5-如何利用SparkMllib构建机器学习推荐架构
  • 6.SparkMllib算法分类及应用场景
  • 7-SparkMllib基础数据类型-localvector
  • 8-SparkMllib基础数据类型-labelpoint
  • 9.SparkMllib基础数据类型-libsvm数据读取
  • 10.SparkMllib基础数据类型-localmatrix
  • 11.SparkMllib基础数据类型-分布式行矩阵和行索引矩阵
  • 12.SparkMllib基础数据类型-分块矩阵
  • 13.SparkMllib均值和方差
  • 14-SparkMllib相关系数
  • 15-SparkMllib假设检验的卡方验证
  • 16-SparkMllib假设检验和随机数的产生
  • 17-特征提取tf-ifd
  • 18-特征提取-word2vec实践
  • 19-特征提取CountVector
1-3 3-SparkMllib库特征工程基础与实战(二)
  • 20-特征转化的二值化操作
  • 21-特征转换-PCA操作
  • 22-特征转换-类别型数据和数值型数据转换
  • 23-特征转换-OneHot编码方式
  • 24-特征转换-VectorIndexer转换操作
  • 25-正则项
  • 26-数值型数据处理的方法
  • 27-Bucketizer分箱
  • 28-ElementWise与SQLTransform实践
  • 29-特征转换VectorAssemble
  • 30-特征转换-QuantileDiscretizer
  • 31-特征选择VectorSlicer
  • 32-RFormula和卡方验证选择特征方法
  • 33-卡方验证案例补充
  • 36-案例实践2-Iris统计初步实践
  • 37-案例实践2-Iris的rdd相关系数实践
  • 38-案例实践2-iris的Dataframe数据统计
  • 39-案例实践2-iris的SParkMllib特征工程实践
1-4 4-SparkMllib决策树算法基础与实战
  • 1-了解什么是决策树
  • 2.基于规则建树
  • 3-信息熵的理解
  • 4-ID3算法步骤详解
  • 5-ID3算法举例和C4.5算法改进
  • 6-决策树的剪枝方式
  • 7-电商购买数据集ID3算法对比实践
  • 8-Cart树的回归树原理理解
  • 9-Cart树算法案例讲解
  • 10-Cart分类树原理及Gini系数
  • 11-Cart分类树的案例
  • 12-SparkMllib实战libsvm数据建模
  • 13-SparkMl实战libsvm数据全流程讲解实战
  • 14-SparkMllib相亲数据建模分析
  • 15-SparkMllib实战iris鸢尾花实战
  • 16-SparkMl实战Iris特征工程及建模实战1
1-5 5-SparkMllib高级模块与线性回归基础及实战
  • 1-SparkMllib的pipeline简介
  • 2-Dataframe组件
  • 3-Pipeline原理
  • 4-通过set方法和ParamMap方法赋值超参数的选项
  • 5-通过pipeline完成案例的代码编写
  • 6-如何对模型选择与优化
  • 7-超参数的网格搜索
  • 8-简单交叉验证及模型选择
  • 9-简单线性回归
  • 10-最小二乘法解决简单线性回归原理
  • 11-多元线性回归简介
  • 12-最小二乘推导补充(补充)
  • 13-线性回归的变体及各适用场景
  • 14-SparkMl实战脂肪数据集的案例
  • 15-SparkMl实战运输时间的预测分析
  • 16-SparkMllib基于RDD结构实战线性回归实例
  • 16-SparkMl实战libsvm数据的形式
  • 17-Sparkml完成房价预测分析实战
1-6 6-SparkMllib聚类算法基础与实战
  • 1-什么是聚类
  • 2-关于多种距离的度量简介
  • 3-聚类算法核心思想
  • 4-KMeans的举例
  • 5-Kmens算法性能指标分析
  • 6-KMeans特点及注意事项
  • 7-SparkMLIB实战KMEans算法
  • 8-SparkMLLIB实现药品数据得简单聚类
  • 9-SparkMl实现基本数据的聚类分析实战
  • 10-SparkMl和parkSql实现经纬度数据聚类分析实战
  • 11-k-medoids了解
  • 12-其他聚类思路-层次聚类方法
  • 13-基于密度的聚类DBSCAN
  • 14-GMM模型原理
  • 15-聚类算法的总结:
  • 16-SparkMllib实现对于层次聚类的分析
  • 17-SparkMllib完成对于GMM高斯混合模型实践分析
  • 18-SparkLDA实现了主题的提取实战
  • 19-SparkML实现IRis鸢尾花的聚类算法实战
1-7 7-SparkGraphX理论基础与实战
  • 1-图基本概念以及图计算应用
  • 2-SparkGraphX简介
  • 3-SparkGraphX图算法
  • 4-SparkGraphX抽象是RDPG---弹性分布式属性图
  • 5-SparkGraphX架构层面及存储方式简介
  • 6-SparkGraphX定义顶点操作
  • 7-SparkGraphX构件图及查询的操作
  • 8-图的基本数据结构
  • 9-图的类型和图的存储方式简介
  • 10-构建图的方法原理及源码了解创建过程
  • 11-构建图的操作代码
  • 12-社交网络数据的创建部分代码实战
  • 13-图的基本信息--顶点、边、入度、出度
  • 14-图的转换操作:mapVertices、mapEdges、mapTriplet
  • 15-图的结构操作:reverse、subgraph、mask、groupGraph
  • 16-图的关联操作
  • 17-图的聚合以及图的操作API总结
1-8 8-SparkGraphX与SparkMllib综合实战
  • 1-PageRank算法的基本假设和理解
  • 2-PageRank算法思想
  • 3-PageRank算法深入
  • 4-SparkGraphX通过社交网络数据完成重要节点的选择
  • 5-通过wiki数据达到网页重要性的pagerank度量
  • 6-通过PageRank算法得到网页排名的重要性
  • 7-广度优先遍历
  • 8-SparkGrphX实现最短路径
  • 9-连通图和强联通图
  • 10-SparkGraphx实战三角关系网络发现
  • 11-SVD++原理
  • 12-SVD++实战推荐算法预测