在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
大数据零基础入门书籍推荐,如果你选择的大数据方向不同小编推荐的书籍也不同,下面主要介绍大数据工程师、数据分析师、数据挖掘工程师就业方向的大数据零基础入门书籍,如果你还没确定选什么方向,小编推荐黑马程序员初版的《Hadoop大数据技术原理与应用》比较适合初学者学习。
一、大数据工程师入门书籍:
在互联网公司广泛招聘偏平台业务方向,ETL和OLTP等,主要是基于Hadoop技术栈来处理大数据,算法要求不是特别高。
经典图书推荐:《Hadoop权威指南》《Hive编程指南》《Hbase权威指南》《大数据技术全解》、《大数据挑战NoSql》《Mahout实战》
二、数据分析师入门书籍:
在拥有行业数据的电商、金融、电信、咨询等行业里做业务咨询,商务智能,出分析报告,互联网公司的产品经理差不多类型了,统计学能力要求高,SPSS、SAS、R、SQL。
经典图书推荐:《概率论与数理统计》、《统计学》推荐David Freedman版、《业务建模与数据挖掘》、《数据挖掘导论》、《SAS编程与数据挖掘商业案例》、《Clementine数据挖掘方法及应用 》、《IBM SPSS Statistics 19 Statistical Procedures Companion》等。
三、数据挖掘工程师入门书籍:
在互联网、电商、搜索、社交等大数据相关行业里做机器学习算法实现和分析,基本数据结构算法、机器学习等都要求较高。Hadoop、spark技术栈,Java、Python、C++、Scala、Shell。
经典图书推荐:《数据挖掘概念与技术》、《数据挖掘导论》、《数据挖掘-实用机器学习技术》;《机器学习》Tom Michael 、《机器学习导论》、周志华《机器学习》、《机器学习实战》、《集体智慧编程》、《统计学习方法》ESL 《Elements of Statistical Learning》 ISL 《An Introduction to Statistical Learning》PRML 《Pattern Recognition and Machine Learning》《数据库系统概论》、《算法导论》、《Web数据挖掘》、《推荐系统》、《数据可视化》《Thinking in Java》、《Python核心编程》、《Thinking in C++》等。
四、大数据零基础入门书:
《Hadoop大数据技术原理与应用》这本书围绕Hadoop生态圈相关系统介绍大数据处理架构Hadoop。全书共11章节,其中,第1-2章主要带领大家认识Hadoop以及学会搭建Hadoop集群。第3-5章讲解了分布式文件系统HDFS、分布式计算框架MapReduce以及分布式协调服务。第6章讲解的是Hadoop2新特性,包含YARN和高可用特性。第7-10章主要讲解Hadoop生态圈的相关辅助系统,包括Hive、Flume、Azkaban和Sqoop。第11章是一个综合项目——网站流量日志数据分析系统,其目的是教会大家如何利用Hadoop生态圈技术构建大数据系统架构并进行开发,同时加深Hadoop技术的理解。
本书可作为高等院校本、专科计算机相关专业、信息管理等相关专业的大数据课程教材,也可供相关技术人员参考,是一本适合广大计算机编程爱好者的优秀读物。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
大数据笔记之分布式文件存储系统
现在是大数据的时代,也是数据爆炸的时代,如何处理大数据的存储成为了摆在人们面前的难题,因此分布式文件存储系统应用而生。同时分布式文件存储系统在大数据面试中,也是一个常常可以见到的考点之一。本文为大家梳理了相关的大数据知识点,感兴趣的小伙伴可以看一看。
6375
2019-11-05 16:26:09
大数据开发为什么要参加系统学习呢?
自从发展大数据产业被写入政府工作报告、BAT高薪聘请专业大数据人才之后,很多小白也开始纷纷转行进入大数据领域。很多的转型者都将参加培训机构看成是自己转型最高效的方式。
3731
2020-12-10 15:31:43
大数据开发和大数据分析该怎么选择?
大数据开发主要是负责大数据挖掘,大数据清洗处理,大数据建模等,负责大规模数据的处理和应用,工作以开发为主与大数据可视化分析工程师相互配合,从数据中挖掘出价值为企业业务发展提供支持。
3960
2021-01-15 10:09:54
大数据Hadoop生态体系中常见的子系统有哪些?
Hadoop是一个针对大量数据进行分布式处理的软件框架,是一个开发和运行处理大规模数据的软件平台,是Appach的一个用Java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算,具有可靠、高效、可伸缩的特点,很多程序会用到这个框架。
4969
2021-03-17 13:58:05
狂野大数据课程好学吗?难不难?
这门课程对标企业5年真实⼤数据从业⼈员的技能⽔平,因此学习这门课程需要有一定的基础,假设课程内容100%吸收⾜以对标甚⾄秒杀企业中5年⼤数据经验的开发⼈员。学成后知识储备完全胜任⾼级⼤数据开发职称。
2864
2022-09-29 16:42:05