• 315h

    课程时长

  • 无限期

    有效期

  • 766

    学习人数

 

 

本课程以案例驱动教学,将真实案例贯穿到知识点中,内容涵盖了大数据体系中的核心技术,包含Linux、Zookeeper、Hadoop、Redis、HDFS、MapReduce、Hive、Impala、Hue、Oozie、Storm、kafka、Spark、Scala、SparkSQL、Hbase等。通过本课程的学习,学员可以快速系统的掌握前沿实用大数据技术原理、应用场景、使用方法。

1.具有开发经验,想要转行从事大数据相关工作的人员

2.具有开发经验,想要将大数据应用于实践的在职人员

5个月

  1. 课程内容重磅升级,技术热点全覆盖

本次课程升级新增当下大数据应用技术热点,使课程更全涵盖大数据体系中的技术点,包括但不限于Linux、Zookeeper、Hadoop、Redis、HDFS、MapReduce、Hive、Impala、Hue、Oozie、Storm、kafka、Spark、Spark RDD、Spark SQL、Spark Streaming、Sqoop、Flume、CDH、Scala、RDD、SparkSQL、Hbase、机器学习数学基础、Python语言、机器学习常用算法、用户画像等,将离线数据分析、实时数据分析和内存数据计算全面覆盖。

  1. 原理讲解深入浅出,通俗易懂

将晦涩难懂的理论以通俗易懂的方式进行讲解,然后通过分析源码的方式让学员深入理解其内在原理,在照顾基础薄弱者的同时又融入核心技术点加以实战,即夯实了基础又快速储备了丰富的实战经验。

  1. 实战项目/案例贯穿始终、边学边练、及时强化

此课程涵盖网站点击流日志分析系统、统一监控告警系统、用户画像、Flume 实战案例、Azkaban实战案例、Hbase实战案例和Hbase整合读写数据等源于企业中的真实项目和案例,以项目/案例驱动教学,将真实实例贯穿到知识点中,学中练、练中学、及时训练、及时强化,让学习者更快掌握大数据实战技术。

第一阶段:大数据基础增强

  • 课程简介

本阶段重点讲解Linux操作基础、Shell编程、Zookeeper集群和hadoop集群环境准备等内容,可以帮助没有Linux基础或者Linux基础薄弱的学员,达到熟练使用Linux、熟练安装Linux上的软件,熟悉负载均衡、高可靠等集群相关概念,搭建互联网高并发、高可靠的服务架构,为大数据内容的深入学习做好充足的准备。

第二阶段:大数据Hadoop离线分布式系统

  • 课程简介

本阶段通过Hadoop集群部署、HDFS、Hive数据仓库等内容以及Impala、Hue等相关新技术的学习,使学习者最终达到具备企业数据部中高级应用开发、初级架构师、Hive工程师和数据仓库工程师的能力。

第三阶段:大数据Storm实时计算系统

  • 课程简介

本阶段通过全面Storm内部机制、原理以及strom实时看板案例的深入讲解和练习,让学习者能够拥有完整项目开发思路和架构设计,掌握从数据采集到实时计算到数据存储再到前台展示的编程能力。

第四阶段:大数据Storm项目实战

  • 项目名称

统一监控告警系统

  • 项目简介

实时采集线上业务系统日志,对接Storm流式计算平台实时分析,出现异常信息,调用告警业务通知相关负责人,达到监控业务系统运行的功能,基于日志进行监控,监控需要一定规则,对触发监控规则的日志信息通过短信和邮件进行告警。

第五阶段:大数据Spark内存计算系统

  • 课程简介

Spark可以用于批处理、交互式查询(Spark SQL)和实时流处理(Spark Streaming)等相关内容,本阶段通过讲解Spark一站式处理框架,让学习者掌握Spark相关的开发技术,达到能够胜任Spark相关工作的能力。

第六阶段:大数据Spark项目实战

  • 项目名称

电商用户画像

  • 项目简介

用户画像是根据用户基本属性、社会属性、生活习惯和消费行业等信息而抽象出的一个标签化的用户模型。构建用户画像的核心工作即是给用户贴“标签”,而标签是通过对用户信息分析而来的高度精炼的特征标识。

第七阶段:机器学习

  • 课程简介

本阶段从机器学习的数学基础到语言基础-Python语言最后过渡到机器学习的算法基础的学习,并通过用户标签预测项目实战、推荐系统实战、CTR点击率预估实战、深度学习基础及图片分类实战等四大实战案例,夯实学习者机器学习的理论基础和实战经验,使学习者能够胜任机器学习、数据挖掘等相关工作。

 

 

 

 

 

 

 

师资团队
  • 大数据高级讲师
    高级讲师
    多年JavaEE开发及编码经验,曾主导多个项目开发,熟悉SpringMVC、MyBatis、Spring等JavaWeb技术,具有多年大数据开发经验,对大数据领域中的常用框架hadoop、hive、flume、kafka、storm、spark等有丰富的实战经验和研究。授课风格严谨,课堂气氛活跃。