在线客服
扫描二维码
下载博学谷APP
扫描二维码
关注博学谷微信公众号
如何有效提升数据分析效率?相信这是所有数据分析工作者都想解决的问题。本文整理了五大Python技巧,分别是Pandas Profiling;使用 Cufflinks 和 Plotly 绘制 Pandas 数据;IPython 魔术命令;Jupyter 中的格式编排;Jupyter 快捷键。相信这些技巧能很好地帮助大家提高数据分析的效率,下面赶紧来看看吧!

1. Pandas Profiling
该工具效果明显。下图展示了调用 df.profile_report() 这一简单方法的结果:
使用该工具只需安装和导入 Pandas Profiling 包。
2. 使用 Cufflinks 和 Plotly 绘制 Pandas 数据
经验丰富的数据科学家或数据分析师大多对 matplotlib 和 pandas 很熟悉。也就是说,你只需调用 .plot() 方法,即可快速绘制简单的 pd.DataFrame 或 pd.Series。
这已经很好了,不过是否可以绘制一个交互式、可缩放、可扩展的全景图呢?是时候让 Cufflinks* *出马了!(Cufflinks 基于 Plotly 做了进一步的包装。)在环境中安装 Cufflinks,只需在终端中运行! pip install cufflinks --upgrade 即可。其他方法如 .scatter_matrix() 也可以提供非常棒的可视化结果。
3. IPython 魔术命令
IPython 的「魔术」是 IPython 基于 Python 标准语法的一系列提升。魔术命令包括两种方法:行魔术命令(line magics):以 % 为前缀,在单个输入行上运行;单元格魔术命令(cell magics):以 %% 为前缀,在多个输入行上运行。下面列举了 IPython 魔术命令提供的一些有用功能:
%lsmagic:找出全部命令
如果你只记得一个魔术命令,那必须得是这一个。执行 %lsmagic 命令将提供所有可用魔术命令的列表。%debug:交互式 debug是最常使用的魔术命令了。大部分数据科学家都遇到过这种情况:执行的代码块一直 break,你绝望地写了 20 个 print() 语句,想输出每个变量的内容。然后,当你最终修复问题后,你还得返回并再次删除所有 print() 语句。不过以后再也不用这样了。遇到问题后只需执行 %debug 命令,即可执行想要运行的任意代码部分。
%store:在 notebook 之间传递变量
这个命令也很酷。假设你花了一些时间清洗 notebook 中的数据,现在你想在另一个 notebook 中测试一些功能,那么你是在同一个 notebook 中实现该功能,还是保存数据并在另一个 notebook 中加载数据呢?使用%store 命令后,这些操作都不需要!该命令将存储变量,你可以在其他任意 notebook 中检索该变量:%store [variable] 存储变量;%store -r [variable] 读取/检索存储变量。
%who:列出所有全局变量。
你是否遇到过,为变量赋值后却忘记变量名的情况?或者不小心删掉了负责为变量赋值的单元格?使用%who 命令,你可以得到所有全局变量的列表。
%%time:计时魔法命令
使用该命令可以获取所有计时信息。只需对任意可执行代码应用%%time 命令。
%%writefile:向文件写入单元格内容
在 notebook 中写复杂函数或类,且想将其保存到专属文件中时,该魔法命令非常有用。只需为函数或类的单元格添加 %%writefile 前缀和想要保存到的文件名即可。我们可以将创建的函数保存到 utils.py 文件中,然后就可以随意导入了。在其他 notebook 中也可以这样,只要与 utils.py 文件属于同一个目录即可。
4. Jupyter 中的格式编排
这个工具很酷!Jupyter 考虑到 markdown 中存在 HTML / CSS 格式。
蓝色、时尚:<div class="alert alert-block alert-info"> This is <b>fancy</b>!</div>
红色、轻微慌张:
<div class="alert alert-block alert-danger">
This is <b>baaaaad</b>!
</div>
绿色、平静:
<div class="alert alert-block alert-success">
This is <b>gooood</b>!
</div>
5. Jupyter 快捷键
想了解和学习键盘快捷键,你可以使用命令面板:Ctrl + Shift + P,获取 notebook 所有功能的列表。下面选取了几个最基础的命令:
Esc:进入命令模式。在命令模式内,你可以使用方向键在 notebook 内进行导航。
在命令模式内:
A 和 B:在当前单元格上方(Above)或下方(Below)插入新的单元格。
M:当前单元格转入 Markdown 状态。
Y:当前单元格转入 code 状态。
D,D:删除当前单元格。
Enter:当前单元格回到编辑模式。
在编辑模式内:
Shift + Tab:为你在当前单元格中键入的对象提供文档字符串(文档),持续使用该快捷键,可循环使用文档模式。
Ctrl + Shift + -:在光标所在处分割当前单元格。
Esc + F:查找并替换代码(不包括输出)。
Esc + O:切换单元格输出。
选择多个单元格:
Shift + Down 和 Shift + Up:选中下方或上方的单元格。
Shift + M:合并选中单元格。
注意,选中多个单元格后,你可以批量执行删除/复制/剪切/粘贴/运行操作。
以上就是有效提升数据分析效率的五大Python技巧,大家都学会了吗?觉得本文对你有帮助的话,不妨把文章分享出去帮助更多的人。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
五个优化Python开发和配置的小技巧
本文主要为大家详细介绍了五个优化Python开发和配置的小技巧,具有一定的参考价值,如果你能在Python开发和配置中中避免这些问题,作为你一个Python开发者你会获得更好的开发体验并且有更高的开发效率。感兴趣的小伙伴们可以参考一下。
8773
2019-07-05 15:37:52
零基础学Python爬虫难不难?要怎么学?
零基础学Python爬虫难不难?要怎么学?众所周知,Python是最容易上手的编程语言,如果有一定基础,学会Python爬虫也是分分钟钟的事。对于零基础的学习者来说,Python爬虫也是比较简单的,只要先学习Python这门编程语言,再会写几行代码就可以做爬虫了。现在的学习资源也有很多,比如在博学谷平台上的Python爬虫教程。一起来看看具体怎么学习Python爬虫吧!
9149
2019-10-11 11:31:19
如何利用pandas绘制可视化图表?
众所周知,Pandas是基于Python平台的大数据分析与处理的利器,它可以把十分复杂的可视化过程,变得简单一点。本文将以2019年世界幸福指数的数据为例,为大家详细展示如何利用pandas绘制可视化图表。相信经过本次手把手教学,大家可以举一反三掌握绘制可视化图表的能力。感兴趣的朋友赶紧来看详细的步骤解析吧!
7786
2020-03-04 18:47:04
5种好用的Python工具分享
Python开发软件可根据其用途不同分为两种,Python代码编辑器和Python集成开发工具,两者配合使用极大的提高Python开发人员的编程效率。掌握调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制等操作。
7417
2020-04-07 16:46:14
Python开发的前景和优势分析
Python开发前景和优势分析,Python作为目前的大势,是很多人转行的首选,会python的人工资通常都比较高。Python在人工智能、大数据、自动化运维、全栈开发方面有着得天独厚的优势,随着Python继续占领编程语言主流的趋势,全国各城市的招聘职位和薪资均会大幅度上涨。
5955
2020-06-09 11:52:23
