课程试听
正在播放
第一章 数据分析师职业概览
1-1 数据分析师的职业概览
  • 数据分析师的“钱”景如何 免费试学
  • 什么人适合学数据分析 免费试学
  • 数据分析师的临界知识 免费试学
  • 数据分析师的主要职责 免费试学
第二章 数据分析和数据挖掘的概念和理论
2-1 基础概念
  • 数据分析及数据挖掘定义 免费试学
  • 数据分析与数据挖掘的层次 免费试学
  • 数据分析及数据挖掘三要素 免费试学
  • 本节小结 免费试学
2-2 探索性数据分析
  • 如何描述业务量数据
  • 可视化展示的原则
  • 本节小结
2-3 预测和分类
  • 预测和分类的概念模型、流程
  • 分类和预测:线性回归
  • 逻辑回归
  • 决策树算法
  • 支持向量机
  • 朴素贝叶斯
  • 本节小结
2-4 分群和降维
  • 聚类算法的基本概念
  • 层次聚类
  • K-means聚类
  • 降维模型-PCA
  • 本节小结
第三章 统计学基础和SPSS软件应用
3-1 描述性统计分析
  • 统计分析的目的
  • 统计分析的关键概念
  • 四种测量尺度
  • 集中趋势-均值
  • 集中趋势-中位数和众数
  • 离散趋势-极差和标准差
  • 案例操作-如何实现离散趋势和集中趋势
  • 本节小结
3-2 假设检验/统计判断
  • 统计学本质
  • 统计学两大定理
  • 统计推断-抽样误差与标准误
  • 统计推断-t分布
  • 统计判断-参数估计
  • 统计推断—假设检验
  • 本节小结
3-3 抽样方法
  • 统计过程
  • 抽样的概念
  • 抽样方法与非抽样方法
  • 抽样调查与普查的特点
  • 非抽样误差
  • 非抽样误差的三种类型
  • 无回答误差的处理
  • 抽样过程
  • 抽样单元与抽样框
  • 抽样形式
  • 概率抽样-简单随机抽样和系统抽样
  • 概率抽样-PPS抽样
  • 概率抽样-分层抽样
  • 非概率抽样-区域抽样、时间抽样和电话抽样
  • 本节小结
3-4 一般线性模型
  • t检验
  • t检验-案例实践
  • F检验
  • F检验-案例实践
  • 相关分析
  • 相关分析-案例实践
  • 线性回归
  • 线性回归-案例实践
  • 本节小结
第四章 数据预处理基础
4-1 数据分析前的准备工作
  • 统计工作流程
  • 统计准备工作
  • 数据检查要点
  • 开放题的准备
  • 本节小结
4-2 数据清洗
  • 数据清洗的概念和流程
  • 字段选择与数据质量报告
  • 数据清洗主要工作
  • 错误值和异常值处理方法
  • 缺失值处理方法
  • 异常值和缺失值的处理操作
  • 本节小结
4-3 数据规范化
  • 数据转化
  • 数据离散化与数据扩充
  • 数据合并与拆分
  • 本节小结
第五章 Mysql教程
5-1 SQL简介
  • SQL简介
  • 建立数据库
  • 建立数据表和约束条件
  • 插入和更改
  • 本节小结
5-2 基本查询语句
  • 基本查询语句
  • 本节小结
5-3 交叉查询和子查询
  • 聚合函数和交叉查询;group by
  • 子查询(in、not in)&模糊匹配 Like
  • 本节小结
5-4 练表查询
  • 连表查询
  • 本节小结
5-5 相关函数
  • 控制流函数
  • 时间函数
  • 常用字符串相关的函数
第六章 Excel分析及可视化
6-1 Excel简介
  • Excel简介
6-2 Excel函数技巧
  • 函数的简介
  • 查找函数—vlookup和hlookup
  • 查找函数—INDEX和MATCH
  • 统计函数
  • 逻辑函数(上)-if、and和or
  • 逻辑函数(下)
  • 日期函数和文本函数
  • 本节小结
6-3 Excel快速处理技巧
  • 宏的技巧
  • 数据透视表和选择性粘贴
  • 格式调整技巧
  • 查找和定位&数据有效性技巧
  • 快捷键相关技巧
  • 本节小结
6-4 Excel可视化技巧
  • 如何制作一张图
  • 组合图的做法
  • 条形图的变体
  • 数据气泡地图的做法
  • 本节小结
第七章 进阶统计学
7-1 多变量分析方法选择思路
  • 多变量分析方法的选择
  • 无监督分析和有监督分析
  • 无监督分析的原则
7-2 因子分析
  • 因子分析使用场景
  • 因子的概念及分析过程
  • 因子数的推定
  • 因子轴的旋转
  • 因子解释及因子得分计算
  • 案例实践
  • 如何用因子分析做评价
7-3 聚类分析
  • 聚类分析使用场景
  • 聚类分析算法
  • 非层次法聚类K-means
  • K-means-案例实践
  • 二阶聚类
7-4 对应分析
  • 对应分析使用目的及结果解读
  • 对应分析案例实践
7-5 多维尺度分析
  • 概念和使用场景
  • 多维尺度分析举例
  • 案例1:根据学生评分进行分座位
  • 案例2:根据学生考试成绩进行分座位
  • 案例3:根据手机的相似度判断竞争力
  • 多维尺度的不足及替代方法
7-6 时间序列分析
  • 时间序列使用场景
  • 两种类型的时间序列
  • 时间序列模型ARIMA
  • 时间序列中的处理方法
  • 案例实践—某连锁超市销售额影响因素预测
7-7 Logistic
  • 使用场景和理论背景
  • Logisitic案例实践-用户流失的影响因素及新用户预测
第八章 经典数据挖掘算法
8-1 数据挖掘基础及数据分层抽样
  • 生活中熟悉的数据挖掘案例
  • 数据准备及数据分割方式
  • 数据分析与数据挖掘的联系与区别
  • Modeler软件介绍
  • 如何在Modeler实现数据分层抽样
8-2 朴素贝叶斯
  • 朴素贝叶斯原理
  • 朴素贝叶斯算法过程
  • 朴素贝叶斯算法举例
  • 朴素贝叶斯算法优点及不足
  • 案例实践-使用贝叶斯网络建模
8-3 决策树
  • 决策树应用场景
  • 决策树算法(1)—ID3
  • 决策树算法(2)—C4.5
  • 决策树算法(3)—回归树CART
  • 决策树算法(4)-CHAID
  • 防止过度拟合的问题
  • 使用Modeler如何做决策树
8-4 神经网络
  • 神经网络的组成
  • 计算误差函数,修正初始权重
  • 神经网络与其他分析的关系
  • 案例实践
8-5 支持向量机
  • 支持向量机原理介绍
  • 线性可分与线性不可分
  • 案例实践
8-6 集成算法和模型评估
  • 集成算法的目的与方式
  • Bagging与Boosting的计算原理
  • 根据混淆矩阵进行模型评估
  • 在Modeler中画出GAIN曲线图和Lift曲线图
  • 学习资料拓展
第九章 R语言入门及基础分析
9-1 R语言基础操作
  • 初识R语言
  • R语言的基本操作
  • R语言的数据结构介绍
  • 向量和矩阵的基本操作
  • 数据框的操作
  • 循环控制流—for&whlie
  • 条件选择控制流-if
  • 自定义函数
  • R语言关于概率分布的函数及应用介绍
  • 离散随机变量分布和连续随机变量分布
9-2 R语言描述性数据分析
  • 探索性数据分析—集中趋势和离中趋势
  • 探索性数据分析—相关系数及函数介绍
  • 探索性数据分析—假设检验
9-3 R语言回归算法
  • 回归基本算法及相关函数介绍(上)
  • 回归基本算法及相关函数介绍(下)
  • 模型选择
  • 回归诊断
9-4 R语言分类算法
  • 逻辑回归(上)
  • 逻辑回归(下)
  • 决策树算法
  • 决策树的剪枝
  • 随机森林
9-5 R语言聚类和降维
  • 使用R如何实现层次聚类
  • 使用R如何实现kmeans聚类法
  • 如何判定聚类的好坏
  • 使用R如何实现PCA降维算法
第十章 Python入门及基础分析
10-1 概述与基本操作
  • 课程与开发环境简介
  • 帮助文档的获取&基础操作
  • 基础操作:整数、小数、复数&列表、字符串、字典
  • 控制流函数
  • 自定义函数
  • Jupyter常用快捷键以及自动补全功能的实现
  • 本节小结
10-2 Numpy
  • 从头创建一个数组
  • 案例实践-如何实现99乘法表和老虎机
  • 数组的操作
  • 数组的计算
  • 数组的广播
  • 比较、掩码和布尔逻辑
10-3 Pandas
  • 序列和数据框
  • 索引和切片
  • 通过索引运算和生成新的列
  • 文件的读取和写入
  • 缺失值处理
  • 数据连接
  • 分组和聚合
  • 数据透视表
  • 字符串的处理
  • 本节小结
10-4 Matplotlib与python作图
  • 基础作图—折线图和散点图
  • 基础作图—直方图和饼图
  • 图表设置--子图和图例
  • 图表设置—标签、表格样式和cmap
  • 高级作图
  • 本节小结
10-5 Sklearn与机器学习基础
  • 线性回归
  • 逻辑回归的原理、模型实现与正则化
  • 逻辑回归的模型的评估以及最优迭代次数
  • 贝叶斯分类器的实现过程
  • 朴素贝叶斯算法案例-手写数字识别
  • 数据预处理
  • 决策树和随机森林—熵和决策树
  • 决策树和随机森林算法对比
  • 随机森林的调参
  • 支持向量机—核函数
  • 支持向量机是如何防止过拟合的
  • 如何使用Python实现PCA降维算法
  • 如何使用Python实现Kmeans聚类
  • 本节小结
第十一章 如何撰写数据分析报告(新增内容!)
11-1 为什么要写数据分析报告?
  • 数据分析报告的目的
  • 数据分析报告的三要素
11-2 如何撰写数据分析报告?
  • 报告内容的风格
  • 报告的内在逻辑(核心!!!)
  • 报告的标题
11-3 如何提升数据分析报告的颜值?
  • 如何提升报告的颜值?
11-4 报告实例分析
  • 案例报告分析
11-5 本章小结
  • 本章小结
第十二章 课程总结图谱
12-1 课程总结图谱
  • 课程总结