课程试听
第一章 数据分析师职业概览
1-1 数据分析师的职业概览
- 数据分析师的“钱”景如何 免费试学
- 什么人适合学数据分析 免费试学
- 数据分析师的临界知识 免费试学
- 数据分析师的主要职责 免费试学
第二章 数据分析和数据挖掘的概念和理论
2-1 基础概念
- 数据分析及数据挖掘定义 免费试学
- 数据分析与数据挖掘的层次 免费试学
- 数据分析及数据挖掘三要素 免费试学
- 本节小结 免费试学
2-2 探索性数据分析
- 如何描述业务量数据
- 可视化展示的原则
- 本节小结
2-3 预测和分类
- 预测和分类的概念模型、流程
- 分类和预测:线性回归
- 逻辑回归
- 决策树算法
- 支持向量机
- 朴素贝叶斯
- 本节小结
2-4 分群和降维
- 聚类算法的基本概念
- 层次聚类
- K-means聚类
- 降维模型-PCA
- 本节小结
第三章 统计学基础和SPSS软件应用
3-1 描述性统计分析
- 统计分析的目的
- 统计分析的关键概念
- 四种测量尺度
- 集中趋势-均值
- 集中趋势-中位数和众数
- 离散趋势-极差和标准差
- 案例操作-如何实现离散趋势和集中趋势
- 本节小结
3-2 假设检验/统计判断
- 统计学本质
- 统计学两大定理
- 统计推断-抽样误差与标准误
- 统计推断-t分布
- 统计判断-参数估计
- 统计推断—假设检验
- 本节小结
3-3 抽样方法
- 统计过程
- 抽样的概念
- 抽样方法与非抽样方法
- 抽样调查与普查的特点
- 非抽样误差
- 非抽样误差的三种类型
- 无回答误差的处理
- 抽样过程
- 抽样单元与抽样框
- 抽样形式
- 概率抽样-简单随机抽样和系统抽样
- 概率抽样-PPS抽样
- 概率抽样-分层抽样
- 非概率抽样-区域抽样、时间抽样和电话抽样
- 本节小结
3-4 一般线性模型
- t检验
- t检验-案例实践
- F检验
- F检验-案例实践
- 相关分析
- 相关分析-案例实践
- 线性回归
- 线性回归-案例实践
- 本节小结
第四章 数据预处理基础
4-1 数据分析前的准备工作
- 统计工作流程
- 统计准备工作
- 数据检查要点
- 开放题的准备
- 本节小结
4-2 数据清洗
- 数据清洗的概念和流程
- 字段选择与数据质量报告
- 数据清洗主要工作
- 错误值和异常值处理方法
- 缺失值处理方法
- 异常值和缺失值的处理操作
- 本节小结
4-3 数据规范化
- 数据转化
- 数据离散化与数据扩充
- 数据合并与拆分
- 本节小结
第五章 Mysql教程
5-1 SQL简介
- SQL简介
- 建立数据库
- 建立数据表和约束条件
- 插入和更改
- 本节小结
5-2 基本查询语句
- 基本查询语句
- 本节小结
5-3 交叉查询和子查询
- 聚合函数和交叉查询;group by
- 子查询(in、not in)&模糊匹配 Like
- 本节小结
5-4 练表查询
- 连表查询
- 本节小结
5-5 相关函数
- 控制流函数
- 时间函数
- 常用字符串相关的函数
第六章 Excel分析及可视化
6-1 Excel简介
- Excel简介
6-2 Excel函数技巧
- 函数的简介
- 查找函数—vlookup和hlookup
- 查找函数—INDEX和MATCH
- 统计函数
- 逻辑函数(上)-if、and和or
- 逻辑函数(下)
- 日期函数和文本函数
- 本节小结
6-3 Excel快速处理技巧
- 宏的技巧
- 数据透视表和选择性粘贴
- 格式调整技巧
- 查找和定位&数据有效性技巧
- 快捷键相关技巧
- 本节小结
6-4 Excel可视化技巧
- 如何制作一张图
- 组合图的做法
- 条形图的变体
- 数据气泡地图的做法
- 本节小结
第七章 进阶统计学
7-1 多变量分析方法选择思路
- 多变量分析方法的选择
- 无监督分析和有监督分析
- 无监督分析的原则
7-2 因子分析
- 因子分析使用场景
- 因子的概念及分析过程
- 因子数的推定
- 因子轴的旋转
- 因子解释及因子得分计算
- 案例实践
- 如何用因子分析做评价
7-3 聚类分析
- 聚类分析使用场景
- 聚类分析算法
- 非层次法聚类K-means
- K-means-案例实践
- 二阶聚类
7-4 对应分析
- 对应分析使用目的及结果解读
- 对应分析案例实践
7-5 多维尺度分析
- 概念和使用场景
- 多维尺度分析举例
- 案例1:根据学生评分进行分座位
- 案例2:根据学生考试成绩进行分座位
- 案例3:根据手机的相似度判断竞争力
- 多维尺度的不足及替代方法
7-6 时间序列分析
- 时间序列使用场景
- 两种类型的时间序列
- 时间序列模型ARIMA
- 时间序列中的处理方法
- 案例实践—某连锁超市销售额影响因素预测
7-7 Logistic
- 使用场景和理论背景
- Logisitic案例实践-用户流失的影响因素及新用户预测
第八章 经典数据挖掘算法
8-1 数据挖掘基础及数据分层抽样
- 生活中熟悉的数据挖掘案例
- 数据准备及数据分割方式
- 数据分析与数据挖掘的联系与区别
- Modeler软件介绍
- 如何在Modeler实现数据分层抽样
8-2 朴素贝叶斯
- 朴素贝叶斯原理
- 朴素贝叶斯算法过程
- 朴素贝叶斯算法举例
- 朴素贝叶斯算法优点及不足
- 案例实践-使用贝叶斯网络建模
8-3 决策树
- 决策树应用场景
- 决策树算法(1)—ID3
- 决策树算法(2)—C4.5
- 决策树算法(3)—回归树CART
- 决策树算法(4)-CHAID
- 防止过度拟合的问题
- 使用Modeler如何做决策树
8-4 神经网络
- 神经网络的组成
- 计算误差函数,修正初始权重
- 神经网络与其他分析的关系
- 案例实践
8-5 支持向量机
- 支持向量机原理介绍
- 线性可分与线性不可分
- 案例实践
8-6 集成算法和模型评估
- 集成算法的目的与方式
- Bagging与Boosting的计算原理
- 根据混淆矩阵进行模型评估
- 在Modeler中画出GAIN曲线图和Lift曲线图
- 学习资料拓展
第九章 R语言入门及基础分析
9-1 R语言基础操作
- 初识R语言
- R语言的基本操作
- R语言的数据结构介绍
- 向量和矩阵的基本操作
- 数据框的操作
- 循环控制流—for&whlie
- 条件选择控制流-if
- 自定义函数
- R语言关于概率分布的函数及应用介绍
- 离散随机变量分布和连续随机变量分布
9-2 R语言描述性数据分析
- 探索性数据分析—集中趋势和离中趋势
- 探索性数据分析—相关系数及函数介绍
- 探索性数据分析—假设检验
9-3 R语言回归算法
- 回归基本算法及相关函数介绍(上)
- 回归基本算法及相关函数介绍(下)
- 模型选择
- 回归诊断
9-4 R语言分类算法
- 逻辑回归(上)
- 逻辑回归(下)
- 决策树算法
- 决策树的剪枝
- 随机森林
9-5 R语言聚类和降维
- 使用R如何实现层次聚类
- 使用R如何实现kmeans聚类法
- 如何判定聚类的好坏
- 使用R如何实现PCA降维算法
第十章 Python入门及基础分析
10-1 概述与基本操作
- 课程与开发环境简介
- 帮助文档的获取&基础操作
- 基础操作:整数、小数、复数&列表、字符串、字典
- 控制流函数
- 自定义函数
- Jupyter常用快捷键以及自动补全功能的实现
- 本节小结
10-2 Numpy
- 从头创建一个数组
- 案例实践-如何实现99乘法表和老虎机
- 数组的操作
- 数组的计算
- 数组的广播
- 比较、掩码和布尔逻辑
10-3 Pandas
- 序列和数据框
- 索引和切片
- 通过索引运算和生成新的列
- 文件的读取和写入
- 缺失值处理
- 数据连接
- 分组和聚合
- 数据透视表
- 字符串的处理
- 本节小结
10-4 Matplotlib与python作图
- 基础作图—折线图和散点图
- 基础作图—直方图和饼图
- 图表设置--子图和图例
- 图表设置—标签、表格样式和cmap
- 高级作图
- 本节小结
10-5 Sklearn与机器学习基础
- 线性回归
- 逻辑回归的原理、模型实现与正则化
- 逻辑回归的模型的评估以及最优迭代次数
- 贝叶斯分类器的实现过程
- 朴素贝叶斯算法案例-手写数字识别
- 数据预处理
- 决策树和随机森林—熵和决策树
- 决策树和随机森林算法对比
- 随机森林的调参
- 支持向量机—核函数
- 支持向量机是如何防止过拟合的
- 如何使用Python实现PCA降维算法
- 如何使用Python实现Kmeans聚类
- 本节小结
第十一章 如何撰写数据分析报告(新增内容!)
11-1 为什么要写数据分析报告?
- 数据分析报告的目的
- 数据分析报告的三要素
11-2 如何撰写数据分析报告?
- 报告内容的风格
- 报告的内在逻辑(核心!!!)
- 报告的标题
11-3 如何提升数据分析报告的颜值?
- 如何提升报告的颜值?
11-4 报告实例分析
- 案例报告分析
11-5 本章小结
- 本章小结
第十二章 课程总结图谱
12-1 课程总结图谱
- 课程总结