• 12h

  课程时长

 • 无限期

  有效期

 • 175

  学习人数

课程简介

本课程采用理论与案例相结合的形式,以Anaconda为主要开发工具,系统全面地介绍了Python数据分析的相关知识。如:数据分析的基本概念,以及开发工具的安装和使用;Python数据分析的常用库及其应用,涵盖了科学计算库NumPy、数据分析库Pandas、数据可视化库Matplotlib、Seaborn与Bokeh,较为全面地讲述了Python数据分析技术等。

适合人群

本课程适合有一定Python基础,想要快速提升且深入学习Python数据分析或者数据可视化的人员使用。

主讲内容

本课程基于Python 3,系统全面地讲解了Python数据分析的基础知识。

第1部分:

主要是带领大家了解数据分析,包括数据分析产生背景、什么是数据分析、数据分析的应用场景、数据分析的流程、开发工具的基本使用及常见数据分析工具等。通过本章的学习,希望大家能够对数据分析有一个初步的认识,并为后续章节的学习准备好开发环境。

第2部分:

主要针对科学计算库NumPy进行讲解,包括创建数组、数据类型、数组运算、索引和切片操作、转置和轴对称、通用函数、使用数组处理数据、线性代数模块及随机数模块等,并结合酒鬼漫步的案例,讲解如何使用NumPy数组参与简单的运算。希望读者能熟练使用NumPy包,为后面章节的学习奠定基础。

第3部分:

主要介绍的是Pandas的基础功能,包括数据结构分析、索引操作、算术运算与数据对齐、数据排序、统计计算与描述、层次化索引和读写操作,并结合北京高考分数线的分析案例,讲解如何使用Pandas操作数据。通过对本章的学习,希望大家可以用Pandas实现简单地操作,为后续深入地学习打好扎实的基础。

第4部分:

进一步介绍了Pandas的数据预处理,包括数据清洗、数据合并、数据重塑和数据转换,并结合预处理部分地区信息的案例,讲解了如何利用Pandas预处理数据。数据预处理是数据分析中必不可少的环节,希望大家要多加练习,并能够在实际场景中选择合理的方式对数据进行预处理操作, 另外还可以参考官网提供的文档深入地学习。

第5部分:

继续介绍了Pandas的聚合与分组运算,包括分组聚合的原理、分组操作、数据聚合及其它分组级运算,并结合运动员基本信息的案例,讲解如何在项目中应用分组与聚合运算。大家在学习与理解的同时,要多加练习,可根据具体情况选择合理的技术进行运用即可。

第6部分:

介绍了几个数据可视化工具,包括Python 2D绘图库Matplotlib、绘制统计数据的库Seaborn和交互式可视化的库Bokeh,并结合某年旅游景点的案例,讲解如何使用Matplotlib库绘制图表辅助分析。希望通过本章的学习,读者可以体会到在数据分析中运用可视化的好处。

第7部分:

围绕着时间序列数据分析进行了介绍,包括创建时间序列、时间序列的索引和切片操作、固定频率的时间序列、时间周期与计算、重采样、滑动窗口及时序模型ARIMA,并结合预测股票收盘价的案例,讲解了在项目中如何用时序模型对时间序列数据进行预测分析。通过对本章内容的学习,读者应该掌握处理时间序列数据的一些技巧,并灵活加以运用。

第8部分:

主要针对文本数据分析进行讲解,包括文本数据分析的工具、文本预处理、文本情感分析、文本相似度和文本分类,并结合商品评论分析的案例,讲解了如何利用NLTK与jieba预处理和分析文本数据。希望通过对本章知识的学习,读者可以理解文本数据分析的原理,以便后续能基于机器学习更深入地去探索。

第9部分:

这部分是一个完整的实战项目,用于统计分析当前北京租房的信息,包括数据收集、预处理数据、数据分析,以及利用图表展现数据。希望通过对本章的学习,读者能够灵活地运用数据分析的技术,具备开发简单项目的能力。

学完收获

本课程涉及的Python数据分析和可视化的学习内容是很丰富的,读者学完后,能够具备以下能力:

1.能够全面地掌握数据分析常见库的使用,例如Numpy、Pandas、Matplotlib、Seaborn、Bokeh库等

2.能够掌握数据清洗、分组和聚合等常见方法

3.能够掌握和时间序列、文本序列相关的数据分析

4.能够结合配套案例,提高动手能力,可以独立对数据进行处理分析及其可视化,真正做到举一反三。

师资团队
 • Python高级讲师
  高级讲师
  具有多年软件开发及教学经验,精通Python、Objective-C、Swift等编程语言。技术扎实,曾主导过多款企业通讯软件开发。授课经验丰富,思路清晰,善于使用引导式授课方式提升学员思考能力。