博学谷 > 优质课 > 所有人 都能学的数据分析课

所有人 都能学的数据分析课

本课程专注于培养数据分析师的数据处理能力、数据分析能力和数据挖掘能力,课程内容从数据库管理、统计理论方法、数据分析主流软件的应用(包括SQL、Excel、SPSS、 Modeler、R、python等)到数据挖掘算法等,对一整套数据分析流程技术进行系统讲解,学完之后,学习者可以直接达到中级数据分析师的水平。

主讲:曾老师、钱老师 | 课程时长:40课时 | 学习人数:201人 | 难度: 基础

服务期

90

  • 随到随学
  • 集中答疑

¥299.00 ¥2999.00

立即报名

第 一 章:数据分析师职业概览

1-1 数据分析师的职业概览

1-1-1 数据分析师的“钱”景如何
1-1-2 什么人适合学数据分析
1-1-3 数据分析师的临界知识
1-1-4 数据分析师的主要职责

第 二 章:数据分析和数据挖掘的概念和理论

2-1 基础概念

2-1-1 数据分析及数据挖掘定义
2-1-2 数据分析与数据挖掘的层次
2-1-3 数据分析及数据挖掘三要素
2-1-4 本节小结

2-2 探索性数据分析

2-2-1 如何描述业务量数据
2-2-2 可视化展示的原则
2-2-3 本节小结

2-3 预测和分类

2-3-1 预测和分类的概念模型、流程
2-3-2 分类和预测:线性回归
2-3-3 逻辑回归
2-3-4 决策树算法
2-3-5 支持向量机
2-3-6 朴素贝叶斯
2-3-7 本节小结

2-4 分群和降维

2-4-1 聚类算法的基本概念
2-4-2 层次聚类
2-4-3 K-means聚类
2-4-4 降维模型-PCA
2-4-5 本节小结

第 三 章:统计学基础和SPSS软件应用

3-1 描述性统计分析

3-1-1 统计分析的目的
3-1-2 统计分析的关键概念
3-1-3 四种测量尺度
3-1-4 集中趋势-均值
3-1-5 集中趋势—中位数和众数
3-1-6 离散趋势-极差和标准差
3-1-7 案例操作-如何实现离散趋势和集中趋势
3-1-8 本节小结

3-2 假设检验/统计判断

3-2-1 统计学本质
3-2-2 统计学两大定理
3-2-3 统计推断-抽样误差与标准误
3-2-4 统计推断-t分布
3-2-5 统计推断—参数估计
3-2-6 统计推断—假设检验
3-2-7 本节小结

3-3 抽样方法

3-3-1 统计过程
3-3-2 抽样的概念
3-3-3 抽样方法与非抽样方法
3-3-4 抽样调查与普查的特点
3-3-5 非抽样误差
3-3-6 非抽样误差的三种类型
3-3-7 无回答误差的处理
3-3-8 抽样过程
3-3-9 抽样单元与抽样框
3-3-10 抽样形式
3-3-11 概率抽样-简单随机抽样和系统抽样
3-3-12 概率抽样-PPS抽样
3-3-13 概率抽样-分层抽样
3-3-14 非概率抽样-区域抽样、时间抽样和电话抽样
3-3-15 本节小结

3-4 一般线性模型

3-4-1 t检验
3-4-2 t检验-案例实践
3-4-3 F检验
3-4-4 F检验-案例实践
3-4-5 相关分析
3-4-6 相关分析-案例实践
3-4-7 线性回归
3-4-8 线性回归-案例实践
3-4-9 本节小结

第 四 章:数据预处理基础

4-1 数据分析前的准备工作

4-1-1 统计工作流程
4-1-2 统计准备工作
4-1-3 数据检查要点
4-1-4 开放题的准备
4-1-5 本节小结

4-2 数据清洗

4-2-1 数据清洗的概念和流程
4-2-2 字段选择与数据质量报告
4-2-3 数据清洗主要工作
4-2-4 错误值和异常值处理方法
4-2-5 缺失值处理方法
4-2-6 异常值和缺少值的处理操作
4-2-7 本节小结

4-3 数据规范化

4-3-1 数据转化
4-3-2 数据离散化与数据扩充
4-3-3 数据合并与拆分
4-3-4 本节小结

第 五 章:Mysql教程

5-1 SQL简介

5-1-1 SQL简介
5-1-2 建立数据库
5-1-3 建立数据表和约束条件
5-1-4 插入和更改
5-1-5 本节小结

5-2 基本查询语句

5-2-1 基本查询语句
5-2-2 本节小结

5-3 交叉查询和子查询

5-3-1 聚合函数和交叉查询;group by
5-3-2 子查询(in、not in)&模糊匹配 Like
5-3-3 本节小结

5-4 练表查询

5-4-1 连表查询
5-4-2 本节小结

第 六 章:Excel分析及可视化

6-1 Excel简介

6-1-1 Excel简介

6-2 Excel函数技巧

6-2-1 函数的简介
6-2-2 查找函数—vlookup和hlookup
6-2-3 查找函数—INDEX和MATCH
6-2-4 统计函数
6-2-5 逻辑函数(上)-if、and和or
6-2-6 逻辑函数(下)
6-2-7 日期函数和文本函数
6-2-8 本节小结

6-3 Excel快速处理技巧

6-3-1 宏的技巧
6-3-2 数据透视表和选择性粘贴
6-3-3 格式调整技巧
6-3-4 查找和定位&数据有效性技巧
6-3-5 快捷键相关技巧
6-3-6 本节小结

6-4 Excel可视化技巧

6-4-1 如何制作一张图
6-4-2 组合图的做法
6-4-3 条形图的变体
6-4-4 数据气泡地图的做法
6-4-5 本节小结

第 七 章:进阶统计学

7-1 多变量分析方法选择思路

7-1-1 多变量分析方法的选择
7-1-2 无监督分析和有监督分析
7-1-3 无监督分析的原则

7-2 因子分析

7-2-1 因子分析使用场景
7-2-2 因子的概念及分析过程
7-2-3 因子数的推定
7-2-4 因子轴的旋转
7-2-5 因子解释及因子得分计算
7-2-6 案例实践
7-2-7 如何用因子分析做评价

7-3 聚类分析

7-3-1 聚类分析使用场景
7-3-2 聚类分析算法
7-3-3 非层次法聚类K-means
7-3-4 K-means-案例实践
7-3-5 二阶聚类

7-4 对应分析

7-4-1 对应分析使用目的及结果解读
7-4-2 对应分析案例实践

7-5 多维尺度分析

7-5-1 概念和使用场景
7-5-2 多维尺度分析举例
7-5-3 案例1:根据学生评分进行分座位
7-5-4 案例2:根据学生考试成绩进行分座位
7-5-5 案例3:根据手机的相似度判断竞争力
7-5-6 多维尺度的不足及替代方法

7-6 时间序列分析

7-6-1 时间序列使用场景
7-6-2 两种类型的时间序列
7-6-3 时间序列模型ARIMA
7-6-4 时间序列中的处理方法
7-6-5 案例实践—某连锁超市销售额影响因素预测

7-7 Logistic

7-7-1 使用场景和理论背景
7-7-2 Logisitic案例实践-用户流失的影响因素及新用户预测

第 八 章:经典数据挖掘算法

8-1 数据挖掘基础及数据分层抽样

8-1-1 生活中熟悉的数据挖掘案例
8-1-2 数据准备及数据分割方式
8-1-3 数据分析与数据挖掘的联系与区别
8-1-4 Modeler软件介绍
8-1-5 如何在Modeler实现数据分层抽样

8-2 朴素贝叶斯

8-2-1 朴素贝叶斯原理
8-2-2 朴素贝叶斯算法过程
8-2-3 朴素贝叶斯算法举例
8-2-4 朴素贝叶斯算法优点及不足
8-2-5 案例实践-使用贝叶斯网络建模

8-3 决策树

8-3-1 决策树应用场景
8-3-2 决策树算法(1)—ID3
8-3-3 决策树算法(2)—C4.5
8-3-4 决策树算法(3)—回归树CART
8-3-5 决策树算法(4)-CHAID
8-3-6 防止过度拟合的问题
8-3-7 使用Modeler如何做决策树

8-4 神经网络

8-4-1 神经网络的组成
8-4-2 计算误差函数,修正初始权重
8-4-3 神经网络与其他分析的关系
8-4-4 案例实践

8-5 支持向量机

8-5-1 支持向量机原理介绍
8-5-2 线性可分与线性不可分
8-5-3 案例实践

8-6 集成算法和模型评估

8-6-1 集成算法的目的与方式
8-6-2 Bagging与Boosting的计算原理
8-6-3 根据混淆矩阵进行模型评估
8-6-4 在Modeler中画出GAIN曲线图和Lift曲线图
8-6-5 学习资料拓展

第 九 章:R语言入门及基础分析

9-1 R语言基础操作

9-1-1 初识R语言
9-1-2 R语言的基本操作
9-1-3 R语言的数据结构介绍
9-1-4 向量和矩阵的基本操作
9-1-5 数据框的操作
9-1-6 循环控制流—for&whlie
9-1-7 条件选择控制流-if
9-1-8 自定义函数
9-1-9 R语言关于概率分布的函数及应用介绍
9-1-10 离散随机变量分布和连续随机变量分布

9-2 R语言描述性数据分析

9-2-1 探索性数据分析—集中趋势和离中趋势
9-2-2 探索性数据分析—相关系数及函数介绍
9-2-3 探索性数据分析—假设检验

9-3 R语言回归算法

9-3-1 回归基本算法及相关函数介绍(上)
9-3-2 回归基本算法及相关函数介绍(下)
9-3-3 模型选择
9-3-4 回归诊断

9-4 R语言分类算法

9-4-1 逻辑回归(上)
9-4-2 逻辑回归(下)
9-4-3 决策树算法
9-4-4 决策树的剪枝
9-4-5 随机森林

9-5 R语言聚类和降维

9-5-1 使用R如何实现层次聚类
9-5-2 使用R如何实现kmeans聚类法
9-5-3 如何判定聚类的好坏
9-5-4 使用R如何实现PCA降维算法

第 十 章:Python入门及基础分析

10-1 概述与基本操作

10-1-1 课程与开发环境简介
10-1-2 帮助文档的获取&基础操作
10-1-3 基础操作:整数、小数、复数&列表、字符串、字典
10-1-4 控制流函数
10-1-5 自定义函数
10-1-6 Jupyter常用快捷键以及自动补全功能的实现
10-1-7 本节小结

10-2 Numpy

10-2-1 从头创建一个数组
10-2-2 案例实践-如何实现99乘法表和老虎机
10-2-3 数组的操作
10-2-4 数组的计算
10-2-5 数组的广播
10-2-6 比较、掩码和布尔逻辑

10-3 Pandas

10-3-1 序列和数据框
10-3-2 索引和切片
10-3-3 通过索引运算和生成新的列
10-3-4 文件的读取和写入
10-3-5 缺失值处理
10-3-6 数据连接
10-3-7 分组和聚合
10-3-8 数据透视表
10-3-9 字符串的处理
10-3-10 本节小结

10-4 Matplotlib与python作图

10-4-1 基础作图—折线图和散点图
10-4-2 基础作图—直方图和饼图
10-4-3 图表设置--子图和图例
10-4-4 图表设置—标签、表格样式和cmap
10-4-5 高级作图
10-4-6 本节小结

10-5 Sklearn与机器学习基础

10-5-1 线性回归
10-5-2 逻辑回归的原理、模型实现与正则化
10-5-3 逻辑回归的模型的评估以及最优迭代次数
10-5-4 贝叶斯分类器的实现过程
10-5-5 朴素贝叶斯算法案例-手写数字识别
10-5-6 数据预处理
10-5-7 决策树和随机森林—熵和决策树
10-5-8 决策树和随机森林算法对比
10-5-9 随机森林的调参
10-5-10 支持向量机—核函数
10-5-11 支持向量机是如何防止过拟合的
10-5-12 如何使用Python实现PCA降维算法
10-5-13 如何使用Python实现Kmeans聚类
10-5-14 本节小结

第 十一 章:课程总结图谱

11-1 课程总结图谱

11-1-1 课程总结

猜你还感兴趣

暂无推荐课程,自己逛逛吧

提示
该课程已在购物车中了,无需重复加入
去购物车