课程试听
阶段一 人工智能
展开第一章 机器学习概述V2.1

1-1 机器学习介绍

- 01-0前置-机器学习科学计算库内容简介
- 01-1讲解-机器学习科学计算库内容简介
- 02-1讲解-人工智能概述
- 02-2点评-人工智能概述
- 03-1讲解-人工智能的发展历程
- 04-1讲解-人工智能主要分支
- 04-2点评-人工智能主要分支
- 05-1讲解-机器学习定义工作流程概述
- 05-2点评-机器学习定义工作流程概述
- 06-1讲解-机器学习工作流程各步骤解释
- 06-2点评-机器学习工作流程各步骤解释
- 06-3点评-机器学习工作流程各步骤解释
- 07-1讲解-机器学习算法分类介绍
- 07-2点评-机器学习算法分类介绍
- 08-1讲解-模型评估
- 08-2点评-模型评估
- 08-3点评-模型评估
- 09-1讲解-Azure机器学习平台实验演示1
- 10-1讲解-Azure机器学习平台实验演示2
- 11-1讲解-深度学习简介
- 11-2点评-深度学习简介
第二章 环境安装和使用V2.1

2-1 环境安装及使用

- 12-1讲解-基础环境安装
- 13-1讲解-jupyter notebook的基本使用1
- 13-2点评-jupyter notebook的基本使用1
- 14-1讲解-jupyter notebook的基本使用2
- 14-2点评-jupyter notebook的基本使用2
- 15-1讲解-matplotlib的基本使用
第三章 matplotlibV2.1

3-1 matplotlib使用

- 01-1讲解-实现基础绘图-某城市温度变换图
- 01-2点评-实现基础绘图-某城市温度变换图
- 02-1讲解-绘图辅助功能完善-某城市温度变换图
- 02-2点评-绘图辅助功能完善-某城市温度变换图
- 03-1讲解-在一个坐标系下绘制多个图像
- 03-2点评-在一个坐标系下绘制多个图像
- 04-1讲解-在多个坐标系下绘制多个图像
- 04-2点评-在多个坐标系下绘制多个图像
- 05-1讲解-常见图形绘制
- 05-2点评-常见图形绘制
第四章 numpyV2.1

4-1 numpy使用

- 06-1讲解-numpy介绍
- 06-2点评-numpy介绍
- 07-1讲解-ndarray介绍
- 07-2点评-ndarray介绍
- 08-1讲解-创建0,1数组,固定范围数组
- 08-2点评-创建0,1数组,固定范围数组
- 09-1讲解-创建随机数组
- 09-2点评-创建随机数组
- 10-1讲解-数组的基本操作
- 10-2点评-数组的基本操作
- 10-3点评-前面总结
- 10-4点评-回顾
- 11-1讲解-ndarray的运算
- 12-1讲解-数组间运算
- 11-2点评-ndarray的运算
- 12-2点评-数组间运算
- 13-1讲解-矩阵复习
- 13-2点评-矩阵复习
- 13-3点评-矩阵复习
第五章 pandasV2.1

5-1 pandas数据结构

- 14-1讲解-pandas介绍
- 14-2点评-pandas介绍
- 15-1讲解-pandas数据结构-series
- 15-2点评-pandas数据结构-series
- 16-1讲解-pandas数据结构-DataFrame1
- 16-2点评-pandas数据结构-DataFrame1
- 16-3点评-回顾总结
- 17-1讲解-pandas数据结构-DataFrame2
- 18-1讲解-pandas数据结构-multiindex和panel
- 18-2点评-pandas数据结构-multiindex和panel
5-2 pandas基础使用

- 01-1讲解-pandas中的索引
- 01-2点评-pandas中的索引
- 02-1讲解-赋值和排序
- 02-2点评-赋值和排序
- 03-1讲解-pandas中的算术运算和逻辑运算
- 03-2点评-pandas中的算术运算和逻辑运算
- 04-1讲解-pandas中的统计函数
- 04-2点评-pandas中的统计函数
- 05-1讲解-pandas中的累计统计函数和自定义函数
- 05-2点评-pandas中的累计统计函数和自定义函数
- 06-1讲解-pandas中绘图方式介绍
- 07-1讲解-pandas中文件的读取和写入
- 07-2点评-pandas中文件的读取和写入
- 07-3点评-pandas中文件的读取和写入
- 07-4点评-内容总结
5-3 pandas高级使用

- 08-1讲解-缺失值的处理
- 08-2点评-缺失值的处理
- 09-1讲解-数据离散化
- 09-2点评-数据离散化
- 10-1讲解-数据表的合并
- 10-2点评-数据表的合并
- 11-1讲解-交叉表和透视表介绍
- 11-2点评-交叉表和透视表介绍
- 11-3点评-内容回顾
- 12-1讲解-分组聚合介绍
- 12-2点评-分组聚合介绍
- 13-1讲解-星巴克案例实现
- 13-2点评-星巴克案例实现
5-4 电影案例分析

- 14-0前置-电影案例分析1
- 14-1讲解-电影案例分析1
- 14-2点评-电影案例分析1
- 15-1讲解-电影案例分析
- 15-2点评-电影案例分析
- 15-3点评-电影案例分析
第六章 seabornV2.1

6-1 绘制统计图

- 01-1讲解-绘制单变量分布
- 01-2点评-绘制单变量分布
- 02-1讲解-绘制双变量分布图形
- 02-2点评-绘制双变量分布图形
6-2 分类数据绘图

- 03-1讲解-类别散点图的绘制
- 03-2点评-类别散点图的绘制
- 03-3点评-内容回顾
- 04-1讲解-类别内的数据分布和统计估计
- 04-2点评-类别内的数据分布和统计估计
6-3 NBA案例

- 05-1讲解-NBA数据获取和相关性基本分析
- 05-2点评-NBA数据获取和相关性基本分析
- 06-1讲解-对数据进行分析-seaborn
- 06-2点评-对数据进行分析-seaborn
- 07-1讲解-衍生变量的可视化实践
- 07-2点评-衍生变量的可视化实践
- 08-1讲解-球队数据分析
- 08-2点评-球队数据分析
6-4 北京租房数据统计分析

- 09-0前置-北京市租房数据获取和重复值与空值处理
- 09-1讲解-北京市租房数据获取和重复值与空值处理
- 09-2点评-北京市租房数据获取和重复值与空值处理
- 10-1讲解-数据类型转换(面积,户型)
- 10-2点评-数据类型转换(面积,户型)
- 11-1讲解-房源数量和位置分布分析
- 11-2点评-房源数量和位置分布分析
- 12-1讲解-户型数量基本分析
- 12-2点评-户型数量基本分析
- 12-3点评-户型数量基本分析
- 13-1讲解-平均租金基本分析
- 13-2点评-平均租金基本分析
- 14-1讲解-面积区间分析
- 14-2点评-面积区间分析
- 14-3点评-内容总结
第七章 K近邻算法V2.1

7-1 k近邻算法介绍

- 01-0前置-K-近邻算法简介
- 01-1讲解-K-近邻算法简介
- 01-2点评-K-近邻算法简介
- 02-1讲解-K近邻算法api初步使用
- 02-2点评-K近邻算法api初步使用
- 03-1讲解-机器学习中距离度量介绍
- 03-2点评-机器学习中距离度量介绍
- 04-1讲解-K值的选择介绍
- 04-2点评-K值的选择介绍
7-2 kd树

- 05-1讲解-kd树和kd树的构造过程
- 05-2点评-kd树和kd树的构造过程
- 06-1讲解-kd树案例实现
- 06-2点评-kd树案例实现
- 06-3点评-内容回顾
- 06-4点评-kd树案例实现
7-3 数据集处理

- 07-1讲解-数据集获取和属性介绍
- 07-2点评-数据集获取和属性介绍
- 08-1讲解-数据可视化介绍
- 08-2讲解-数据可视化介绍
- 09-1讲解-数据集的划分
- 09-2点评-数据集的划分
7-4 特征工程

- 10-1讲解-特征预处理简介
- 10-2点评-特征预处理简介
- 11-1讲解-归一化和标准化介绍
- 11-2点评-归一化和标准化介绍
- 11-3点评-归一化和标准化介绍
7-5 KNN总结

- 12-1讲解-鸢尾花种类预测
- 12-2点评-鸢尾花种类预测
- 12-3点评-内容总结
- 12-4点评-内容回顾
- 13-1讲解-KNN算法总结
- 13-2点评-KNN算法总结
7-6 交叉验证, 网格搜索

- 14-1讲解-交叉验证、网格搜索概念介绍
- 14-2点评-交叉验证、网格搜索概念介绍
- 15-1讲解-交叉验证、网格搜索案例实现
- 15-2点评-交叉验证、网格搜索案例实现
7-7 案例 Facebook位置预测

- 01-1讲解-案例-Facebook位置预测流程分析
- 01-2点评-案例-Facebook位置预测流程分析
- 02-1讲解-案例-Facebook位置预测代码实现1
- 02-2点评-案例-Facebook位置预测代码实现1
- 03-1讲解-案例-Facebook位置预测代码实现2
- 03-3点评-案例-Facebook位置预测代码实现2
- 04-1讲解-补充-数据分割和留出法
- 04-2点评-补充-数据分割和留出法
- 05-1讲解-补充-交叉验证法和自助法
- 05-2点评-补充-交叉验证法和自助法
第八章 线性回归V2.1

8-1 回归介绍

- 06-1讲解-线性回归简介
- 06-2点评-线性回归简介
- 07-1讲解-初始线性回归api
- 08-1讲解-数学:求导
- 08-2点评-数学:求导
8-2 损失优化

- 09-1讲解-线性回归中损失函数的介绍
- 09-2点评-线性回归中损失函数的介绍
- 10-1讲解-使用正规方程对损失函数进行优化
- 10-2点评-使用正规方程对损失函数进行优化
- 11-1讲解-使用梯度下降法对损失函数进行优化
- 11-2点评-使用梯度下降法对损失函数进行优化
8-3 回归相关知识

- 12-1讲解-梯度下降法方法介绍
- 12-2点评-梯度下降法方法介绍
- 12-3点评-内容回顾
- 13-0前置-线性回归api再介绍
- 13-1讲解-线性回归api再介绍
- 13-2点评-线性回归api再介绍
- 14-1讲解-波士顿房价预测案例
- 14-2点评-波士顿房价预测案例
- 15-1讲解-欠拟合和过拟合的介绍
- 15-2点评-欠拟合和过拟合的介绍
- 16-1讲解-正则化线性模型
- 16-2点评-正则化线性模型
- 17-1讲解-岭回归介绍
- 17-2点评-岭回归介绍
- 18-1讲解-模型保存和加载
- 18-2点评-模型保存和加载
第九章 逻辑回归V2.1

9-1 逻辑回归

- 01-1讲解-逻辑回归介绍
- 01-2点评-逻辑回归介绍
- 02-1讲解-逻辑回归api介绍
- 02-2点评-内容回顾
- 03-1讲解-肿瘤预测案例
- 03-2点评-肿瘤预测案例
- 04-1讲解-分类评估方法介绍
- 04-2点评-分类评估方法介绍
- 05-1讲解-roc曲线绘制过程
- 05-2点评-roc曲线绘制过程
- 05-3点评-roc曲线绘制过程
- 06-1讲解-补充-类别不平衡数据介绍
- 06-2点评-补充-类别不平衡数据介绍
- 07-1讲解-补充-过采样和欠采样介绍
- 07-2点评-补充-过采样和欠采样介绍
第十章 决策树V2.1

10-1 信息增益

- 08-1讲解-决策树算法简介
- 09-1讲解-熵的介绍
- 09-2点评-熵的介绍
- 09-3点评-内容回顾
- 09-3点评-熵的介绍
- 10-0前置-信息增益的介绍
- 10-1讲解-信息增益的介绍
- 10-2点评-信息增益的介绍
- 11-1讲解-信息增益率的介绍
- 11-2点评-信息增益率的介绍
- 12-1讲解-基尼指数的介绍
- 12-2点评-基尼指数的介绍
- 13-1讲解-决策树划分原理小结
- 13-2点评-决策树划分原理小结
- 14-1讲解-cart剪枝介绍
- 14-2点评-cart剪枝介绍
10-2 特征提取

- 15-1讲解-字典特征提取
- 15-2点评-字典特征提取
- 16-1讲解-英文文本特征提取
- 16-2点评-英文文本特征提取
- 17-1讲解-中文文本特征提取
- 17-2点评-中文文本特征提取
- 18-1讲解-tfidf内容讲解
- 18-2点评-tfidf内容讲解
- 18-3点评-tfidf内容讲解
10-3 案例:泰坦生存预测

- 01-1讲解-决策树算法api介绍
- 01-2点评-决策树算法api介绍
- 02-1讲解-泰坦尼克号乘客生存预测
- 02-2点评-泰坦尼克号乘客生存预测
- 03-1讲解-树木可视化操作
- 03-2点评-树木可视化操作
10-4 回归决策树

- 04-1讲解-回归决策树介绍
- 04-2点评-回归决策树介绍
- 05-1讲解-回归决策树和线性回归对比
- 05-2点评-回归决策树和线性回归对比
第十一章 集成学习V2.1

11-1 集成介绍

- 06-1讲解-集成学习基本介绍
- 07-1讲解-bagging和随机森林
- 07-2点评-bagging和随机森林
- 07-3点评-bagging和随机森林
- 07-4点评-内容回顾
11-2 随机森林案例

- 08-1讲解-otto案例介绍以及数据获取
- 08-2点评-otto案例介绍以及数据获取
- 09-1讲解-otto数据基本处理
- 09-2点评-otto数据基本处理
- 10-1讲解-otto数据模型基本训练
- 10-2点评-otto数据模型基本训练
- 11-1讲解-模型调优和确定最优模型
- 11-2点评-模型调优和确定最优模型
- 11-3点评-模型调优和确定最优模型
- 12-1讲解-生成提交数据
- 12-2点评-生成提交数据
11-3 集成学习

- 13-1讲解-boosting介绍
- 13-2点评-boosting介绍
- 14-1讲解-GBDT的介绍
- 14-2点评-GBDT的介绍
第十二章 聚类算法V2.1

12-1 聚类算法

- 01-1讲解-聚类算法介绍
- 02-1讲解-聚类算法api初步实现
- 02-2点评-聚类算法api初步实现
- 03-1讲解-聚类算法实现流程
- 03-2点评-聚类算法实现流程
- 04-1讲解-模型评估
- 04-2点评-模型评估
- 05-1讲解-算法优化介绍
- 05-2点评-算法优化介绍
- 06-1讲解-特征降维内容介绍
- 06-2点评-特征降维内容介绍
- 07-1讲解-pca降维介绍
- 08-1讲解-用户对物品类别的喜好细分案例
- 08-2点评-用户对物品类别的喜好细分案例
第十三章 朴素贝叶斯V2.1

13-1 朴素贝叶斯

- 09-1讲解-初始朴素贝叶斯
- 09-2点评-初始朴素贝叶斯
- 10-1讲解-概率内容复习
- 10-2点评-概率内容复习
- 11-1讲解-朴素贝叶斯计算案例
- 11-2点评-朴素贝叶斯计算案例
- 12-1讲解-朴素贝叶斯案例实现1
- 13-1讲解-朴素贝叶斯案例实现2
- 13-2点评-朴素贝叶斯案例实现2
- 13-3点评-内容回顾
- 13-4点评-内容回顾
- 14-1讲解-朴素贝叶斯内容总结
- 14-2点评-朴素贝叶斯内容总结
第十四章 SVM算法V2.1

14-1 SVM算法

- 01-1讲解-SVM基本介绍
- 01-2点评-SVM基本介绍
- 02-1讲解-SVM算法api初步使用
- 03-1讲解-SVM算法推导的目标函数
- 03-2点评-SVM算法推导的目标函数
- 04-1讲解-SVM目标函数推导过程及举例
- 04-2点评-SVM目标函数推导过程及举例
- 04-3点评-内容回顾
- 05-1讲解-SVM损失函数
- 05-2点评-SVM损失函数
- 06-1讲解-SVM的核方法介绍
- 06-2点评-SVM的核方法介绍
- 07-1讲解-SVM回归介绍
- 07-2点评-SVM回归介绍
- 08-1讲解-SVM算法api再介绍
- 08-2点评-SVM算法api再介绍
- 09-1讲解-数字识别器案例初步介绍
- 09-2点评-数字识别器案例初步介绍
- 10-1讲解-数字识别器-获取数据
- 10-2点评-数字识别器-获取数据
- 11-1讲解-数字识别器-数据基本处理和模型训练
- 11-2点评-数字识别器-数据基本处理和模型训练
- 12-1讲解-SVM总结
- 12-2点评-SVM总结
- 12-3点评-内容总结
第十五章 EM算法V2.1

15-1 EM算法

- 01-1讲解-初识EM算法
- 01-2点评-初识EM算法
- 02-1讲解-EM算法介绍
- 02-2点评-EM算法介绍
- 02-3点评-内容回顾
- 03-0前置-EM算法实例
- 03-1讲解-EM算法实例
- 03-2点评-EM算法实例
第十六章 HMM算法V2.1

16-1 HMM算法

- 04-1讲解-马尔科夫链的介绍
- 04-2点评-马尔科夫链的介绍
- 05-1讲解-HMM模型的简单案例
- 05-2点评-HMM模型的简单案例
- 06-1讲解-HMM模型三种经典问题举例求解
- 06-2点评-HMM模型三种经典问题举例求解
- 07-1讲解-HMM模型基础
- 07-2点评-HMM模型基础
- 08-1讲解-前向后向算法评估观察序列概率
- 08-2点评-前向后向算法评估观察序列概率
- 08-3点评-内容回顾
- 08-4点评-前向后向算法评估观察序列概率
- 09-1讲解-维特比算法解码隐藏状态序列
- 09-2点评-维特比算法解码隐藏状态序列
- 10-1讲解-鲍姆-韦尔奇算法简介
- 11-1讲解-HMM模型api介绍及案例代码实现
- 11-2点评-HMM模型api介绍及案例代码实现
第十七章 集成学习进阶V2.1

17-1 XGBoost算法

- 01-1讲解-xgboost最优模型构建方法
- 01-2点评-xgboost最优模型构建方法
- 02-1讲解-目标函数确定和树的复杂度介绍
- 02-2点评-目标函数确定和树的复杂度介绍
- 03-1讲解-XGBoost目标函数的推导
- 03-2点评-回顾
- 03-2点评-XGBoost目标函数的推导
- 04-1讲解-XGBoost的回归树构建方法
- 04-2点评-XGBoost的回归树构建方法
- 05-1讲解-XGBoost和GBDT的区别
- 05-2点评-XGBoost和GBDT的区别
- 06-1讲解-xgboost算法api与参数介绍
- 06-2点评-xgboost算法api与参数介绍
- 07-1讲解-xgboost简单案例介绍
17-2 otto案例

- 08-1讲解-otto案例xgboost实现-数据基本处理
- 08-2点评-otto案例xgboost实现-数据基本处理
- 08-3点评-otto案例xgboost实现-数据基本处理
- 09-1讲解-otto案例xgboost实现-模型基本训练
- 10-1讲解-otto案例xgboost实现-模型调优
- 10-2点评-otto案例xgboost实现-模型调优
- 10-3点评-内容回顾
- 11-1讲解-otto案例xgboost实现-最优模型运行
17-3 lightGBM算法

- 01-1讲解-lightGBM简单介绍
- 01-2点评-lightGBM简单介绍
- 02-1讲解-lightGBM算法原理介绍
- 02-2点评-lightGBM算法原理介绍
- 03-1讲解-lightGBM算法api参数介绍
- 03-2点评-lightGBM算法api参数介绍
- 04-1讲解-lightGBM算法简单案例介绍
- 04-2点评-lightGBM算法简单案例介绍
- 05-1讲解-pubg案例简介
- 05-2点评-pubg案例简介
17-4 绝地求生案例

- 06-1讲解-获取pubg数据
- 06-2点评-获取pubg数据
- 07-1讲解-数据缺失值处理和查看每场比赛人数
- 07-2点评-数据缺失值处理和查看每场比赛人数
- 07-3点评-内容回顾
- 08-1讲解-规范化输出部分数据和部分变量合成
- 09-1讲解-异常值处理1
- 09-2点评-异常值处理1
- 10-1讲解-异常值值处理2
- 10-2点评-异常值值处理2
- 11-1讲解-类别型数据处理
- 11-2点评-类别型数据处理
- 12-1讲解-数据截取、确定特征值和目标值、分割数据集
- 13-1讲解-使用RF进行模型训练
- 13-2点评-使用RF进行模型训练
- 14-1讲解-lightGBM对模型调优1
- 14-2点评-lightGBM对模型调优1
- 15-1讲解-lightGBM对模型调优2
- 15-2点评-lightGBM对模型调优2
阶段二 数据挖掘
展开第一章 SparkMllib数据挖掘+SparkGraphX

1-1 1-SparkMllib机器学习理论基础详解

- 01-机器学习和大数据的区别(一)
- 02-机器学习和大数据的区别和联系(二)
- 03-机器学习和大数据的区别和联系(三)
- 04-人工智能和机器学习的区别
- 05-数据分析和数据挖掘联系
- 06-什么是机器学习问题
- 07-基于规则的学习和基于模型的学习方式
- 08-机器学习数据集概述1
- 09-机器学习数据集概述2
- 10-机器学习数据集概述3
- 11-机器学习问题分类
- 12-机器学习三要素强化
- 13-构建机器学习模型的流程
- 14-模型选择
- 15-交叉验证及经验和结构风险
1-2 2-SparkMllib库特征工程基础与实战(一)

- 01-SparkMllib的功能
- 2-SparkMllib的版本
- 3-SparkMllib架构
- 4-环境搭建及RDD、DF、DS的转换实践
- 5-如何利用SparkMllib构建机器学习推荐架构
- 6.SparkMllib算法分类及应用场景
- 7-SparkMllib基础数据类型-localvector
- 8-SparkMllib基础数据类型-labelpoint
- 9.SparkMllib基础数据类型-libsvm数据读取
- 10.SparkMllib基础数据类型-localmatrix
- 11.SparkMllib基础数据类型-分布式行矩阵和行索引矩阵
- 12.SparkMllib基础数据类型-分块矩阵
- 13.SparkMllib均值和方差
- 14-SparkMllib相关系数
- 15-SparkMllib假设检验的卡方验证
- 16-SparkMllib假设检验和随机数的产生
- 17-特征提取tf-ifd
- 18-特征提取-word2vec实践
- 19-特征提取CountVector
1-3 3-SparkMllib库特征工程基础与实战(二)

- 20-特征转化的二值化操作
- 21-特征转换-PCA操作
- 22-特征转换-类别型数据和数值型数据转换
- 23-特征转换-OneHot编码方式
- 24-特征转换-VectorIndexer转换操作
- 25-正则项
- 26-数值型数据处理的方法
- 27-Bucketizer分箱
- 28-ElementWise与SQLTransform实践
- 29-特征转换VectorAssemble
- 30-特征转换-QuantileDiscretizer
- 31-特征选择VectorSlicer
- 32-RFormula和卡方验证选择特征方法
- 33-卡方验证案例补充
- 36-案例实践2-Iris统计初步实践
- 37-案例实践2-Iris的rdd相关系数实践
- 38-案例实践2-iris的Dataframe数据统计
- 39-案例实践2-iris的SParkMllib特征工程实践
1-4 4-SparkMllib决策树算法基础与实战

- 1-了解什么是决策树
- 2.基于规则建树
- 3-信息熵的理解
- 4-ID3算法步骤详解
- 5-ID3算法举例和C4.5算法改进
- 6-决策树的剪枝方式
- 7-电商购买数据集ID3算法对比实践
- 8-Cart树的回归树原理理解
- 9-Cart树算法案例讲解
- 10-Cart分类树原理及Gini系数
- 11-Cart分类树的案例
- 12-SparkMllib实战libsvm数据建模
- 13-SparkMl实战libsvm数据全流程讲解实战
- 14-SparkMllib相亲数据建模分析
- 15-SparkMllib实战iris鸢尾花实战
- 16-SparkMl实战Iris特征工程及建模实战1
1-5 5-SparkMllib高级模块与线性回归基础及实战

- 1-SparkMllib的pipeline简介
- 2-Dataframe组件
- 3-Pipeline原理
- 4-通过set方法和ParamMap方法赋值超参数的选项
- 5-通过pipeline完成案例的代码编写
- 6-如何对模型选择与优化
- 7-超参数的网格搜索
- 8-简单交叉验证及模型选择
- 9-简单线性回归
- 10-最小二乘法解决简单线性回归原理
- 11-多元线性回归简介
- 12-最小二乘推导补充(补充)
- 13-线性回归的变体及各适用场景
- 14-SparkMl实战脂肪数据集的案例
- 15-SparkMl实战运输时间的预测分析
- 16-SparkMllib基于RDD结构实战线性回归实例
- 16-SparkMl实战libsvm数据的形式
- 17-Sparkml完成房价预测分析实战
1-6 6-SparkMllib聚类算法基础与实战

- 1-什么是聚类
- 2-关于多种距离的度量简介
- 3-聚类算法核心思想
- 4-KMeans的举例
- 5-Kmens算法性能指标分析
- 6-KMeans特点及注意事项
- 7-SparkMLIB实战KMEans算法
- 8-SparkMLLIB实现药品数据得简单聚类
- 9-SparkMl实现基本数据的聚类分析实战
- 10-SparkMl和parkSql实现经纬度数据聚类分析实战
- 11-k-medoids了解
- 12-其他聚类思路-层次聚类方法
- 13-基于密度的聚类DBSCAN
- 14-GMM模型原理
- 15-聚类算法的总结:
- 16-SparkMllib实现对于层次聚类的分析
- 17-SparkMllib完成对于GMM高斯混合模型实践分析
- 18-SparkLDA实现了主题的提取实战
- 19-SparkML实现IRis鸢尾花的聚类算法实战
1-7 7-SparkGraphX理论基础与实战

- 1-图基本概念以及图计算应用
- 2-SparkGraphX简介
- 3-SparkGraphX图算法
- 4-SparkGraphX抽象是RDPG---弹性分布式属性图
- 5-SparkGraphX架构层面及存储方式简介
- 6-SparkGraphX定义顶点操作
- 7-SparkGraphX构件图及查询的操作
- 8-图的基本数据结构
- 9-图的类型和图的存储方式简介
- 10-构建图的方法原理及源码了解创建过程
- 11-构建图的操作代码
- 12-社交网络数据的创建部分代码实战
- 13-图的基本信息--顶点、边、入度、出度
- 14-图的转换操作:mapVertices、mapEdges、mapTriplet
- 15-图的结构操作:reverse、subgraph、mask、groupGraph
- 16-图的关联操作
- 17-图的聚合以及图的操作API总结
1-8 8-SparkGraphX与SparkMllib综合实战

- 1-PageRank算法的基本假设和理解
- 2-PageRank算法思想
- 3-PageRank算法深入
- 4-SparkGraphX通过社交网络数据完成重要节点的选择
- 5-通过wiki数据达到网页重要性的pagerank度量
- 6-通过PageRank算法得到网页排名的重要性
- 7-广度优先遍历
- 8-SparkGrphX实现最短路径
- 9-连通图和强联通图
- 10-SparkGraphx实战三角关系网络发现
- 11-SVD++原理
- 12-SVD++实战推荐算法预测