博学谷 > 资讯 > Python > Python数据科学家学习计划分几步?

原创 Python数据科学家学习计划分几步?

发布时间:2020-03-26 16:37:36 浏览 117 来源:博学谷 作者:吾非鱼

      Python数据科学家学习计划分几步?起步开始学习旅程之前,要清楚为什么使用Python?Python如何发挥作用?首先我们需要一份关于数据分析方面的Python学习路径,适合新手入门学习。

     

    Python数据科学家学习计划
      Python数据科学家学习计划八个步骤:


      一、设置机器环境
      设置机器环境。最简单的方法就是从官网上下载分发包Anaconda。Anaconda将以后可能会用到的大部分的东西进行了打包。采用这个方法的主要缺点是,即使可能已经有了可用的底层库的更新,你仍然需要等待Continuum去更新Anaconda包。当然如果你是一个初学者,这应该没什么问题。


      步骤2:二、
      了解Python语言的基础知识、库和数据结构。Codecademy上的Python课程是你最好的选择之一。完成这个课程后,你就能轻松的利用Python写一些小脚本,同时也能理解Python中的类和对象。具体学习内容:列表Lists,元组Tuples,字典Dictionaries,列表推导式,字典推导式。


      任务:解决HackerRank上的一些Python教程题,这些题能让你更好的用Python脚本的方式去思考问题。


      三、Python语言中的正则表达式

      经常用到正则表达式来进行数据清理,尤其是当你处理文本数据的时候。学习正则表达式的最好方法是参加谷歌的Python课程,它会让你能更容易的使用正则表达式。


      四、学习Python中的科学库—NumPy, SciPy, Matplotlib以及Pandas
      根据NumPy教程进行完整的练习,特别要练习数组arrays。这将会为下边的学习旅程打好基础。接下来学习Scipy教程。看完Scipy介绍和基础知识后,你可以根据自己的需要学习剩余的内容。并不需要学习Matplotlib教程。对于我们这里的需求来说,Matplotlib的内容过于广泛。目前只需要简单了解一些就可以了。
      学习Pandas。Pandas为Python提供DataFrame功能(类似于R)。这也是你应该花更多的时间练习的地方。Pandas会成为所有中等规模数据分析的最有效的工具。


      五、有用的数据可视化

     

      六、Scikit-learn库和机器学习的内容
      Scikit-learn是机器学习领域最有用的Python库。这里是该库的简要概述。完成哈佛CS109课程的课程10到课程18,这些课程包含了机器学习的概述,同时介绍了像回归、决策树、整体模型等监督算法以及聚类等非监督算法。你可以根据各个课程的任务来完成相应的课程。


      七、练习
      如何练习?比通过在Kaggle上和数据科学家们进行竞赛来练习更好的方式吗?深入一个当前Kaggle上正在进行的比赛,尝试使用你已经学过的所有知识来完成这个比赛。


      八、深度学习
      已经学习了大部分的机器学习技术,需要关注一下深度学习。很可能你已经知道什么是深度学习。深度学习的新手,建议在deeplearning.net上有深度学习方面最全面的资源,讲座、数据集、挑战、教程等。尝试参加培训班课程了解神经网络的基本知识。

上一篇:零基础学习python? 下一篇:Python源码学习新手攻略

相关推荐 更多

最新文章

扫描二维码,回复"Python"获取100G资料包