学完该课程,将 熟练掌握大数据常见的实时以及离线开发框架,具备从0到1的架构设计以及开发能力,能够胜任 hadoop开发工程师,spark开发工程师,flink开发工程师等职位

云计算大数据在线就业班2.0

课程以案例驱动教学,将真实案例贯穿到知识点中,内容涵盖市场常见的大数据开发技术

课程时长:200课时 学习人数:872人 服务期:365天 就业率:98% 平均月薪:21K

教学服务

  • 随到随学
  • 学前测试
  • 专属学习档案
  • 班主任督导
  • 新手任务
  • 每周学习反馈
  • 闯关式学习
  • 答疑辅导
  • 直播串讲
  • 作业批改
  • 全方位学习测评
  • 问答讨论
  • 配套教辅
  • 源码开放
  • 1V1就业服务
  • 学习报告
  • ¥14980.00 ¥16980.00

    本课程为具有一定编程开发经验的学员而准备,共分为八大阶段,从大数据基础增强开始,内容精准聚焦大数据开发过程中必备的离线数据分析、实时数据分析和内存数据计算等重要内容;涵盖了大数据体系中几乎所有的核心技术,包含Linux、Zookeeper、Hadoop、Redis、HDFS、MapReduce、Hive、lmpala、Hue、Oozie、Storm、Kafka、Spark、Scala、SparkSQL、Hbase、Flink、机器学习等

    学完收获:

    熟练掌握大数据开发思维,掌握jvm优化

    熟练掌握hdfs的开发应用以及原理

    熟练掌握MapReduce运行原理及程序开发能力

    熟练掌握hive数据仓库的开发

    熟练掌握hbase列式数据库优化及开发

    熟练掌握azkaban,impala,oozie,hue,zookeeper等hadoop生态圈组件

    熟练掌握分布式消息中间件kafka的原理及应用

    熟练掌握storm流计算编程原理以及企业级应用

    熟练掌握scala编程知识

    熟练掌握spark内存计算的搭建使用及运行原理

    熟练掌握sparksql,sparksteaming等spark一站式开发框架的应用

    熟练掌握Flink开发框架的企业级应用

    理解机器学习主流算法的应用

    具有编程开发经验,想要转行从事大数据相关工作的人员
    具有编程开发经验,想要将大数据应用于实践的在职人员

    亮点1

    课程重磅
    升级
    技术热点全
    覆盖

    本次升级新增当下大数据应用
    技术热点,使课程更全涵盖大
    数据体系中的技术点,包括但
    不限于Linux、Zookeeper、
    Hadoop、Yam、Redis、HD
    FS、MapReduce、Hive、lm
    pala、Hue、Oozie、Storm
    、Kafka、Spark、Soark RDD
    、Spark SQL、Soark Stream
    ing、Sqoop、Flume、CDH
    、Scala、Hbase、Flink、机器
    学习等,将离线数据分析、实
    时数据分析和内存数据计算中
    的技术点全面覆盖

    亮点2

    原理讲解
    深入浅出
    通俗易懂

    将晦涩难懂的理论一通俗易懂
    的方式进行讲解,然后通过深
    入分析源码让学员深入理解其
    内在原理,在照顾基础薄弱学
    习者的同时又融入核心技术点
    加以实战,夯实了基础又快速
    储备了丰富的实战经验

    亮点3

    实战项目/案
    例贯穿始终
    边学边练
    及时强化

    此课程涵盖网站点击流日志分
    析系统、统一监控告警系统、
    用户画像、Flume 实战案例、
    Azkaban实战案例、Hbase实
    战案例和Hbase整合读写数据
    等源于企业中的真实项目和案
    例,以项目/案例驱动教学,将
    真实实例贯穿到知识点中,学
    中练、练中学、及时训练、及
    时强化,让学习者更快掌握大
    数据实战技术

    阶段一 : 基础增强

    14.25
    小时

    |

    15
    知识要点

    基础巩固

    linux操作基础、shell编程、hadoop集群环境准备、zookeeper集群、网络编程与总结

    JVM优化(上)

    课程介绍、JVM运行参数、JVM内存模型、jmap命令的使用、jstack命令的使用、VisualVM工具的使用

    JVM优化(中)

    JVM垃圾回收算法、JVM垃圾收集器

    JVM优化(下)

    Tomcat8优化、JVM字节码、代码优化建议

    市场价值 : 能够完成中小型企业常见的自动化脚本

    阶段二 : hadoop 离线分布式系统

    53.73
    小时

    |

    20
    知识要点

    hadoop环境搭建2.0

    hadoop源生集群搭建、CDH版本集群搭建

    hdfs

    hdfs入门、hdfs深入

    mapreduce

    mapreduce入门、mapreduce深入学习、mapreduce高级

    yarn

    yarn

    hive

    hive安装、hive基本操作、hive高级用法、hive调优

    辅助系统工具

    flume、azkaban调度、sqoop

    网站点击流项目

    网站点击流项目(上)、网站点击流项目(下)

    IMPALA

    IMPALA

    HUE

    HUE

    OOZIE

    OOZIE

    市场价值 : 能够胜任离线相关工作,包括ETL工程师、hadoop开发工程师、hadoop运维工程师、Hive工程师
    、数据仓库工程师等

    阶段三 : 大数据Storm实时计算系统

    10.82
    小时

    |

    4
    知识要点

    kafka消息队列

    kafka消息队列

    storm编程

    storm编程、strom实时看板案例、storm高级应用

    市场价值 : 能够胜任Storm实时计算相关工作,包括ETL工程师、大数据开发工程师、Storm流式计算工程师

    阶段四 : strom项目篇

    4.2
    小时

    |

    2
    知识要点

    项目开发

    strom日志告警、strom路由器项目开发

    市场价值 : 能够胜任流计算开发工作,流式计算工程师、大数据开发工程师等相关工作

    阶段五 : 大数据 Spark 内存计算系统

    47.52
    小时

    |

    38
    知识要点

    Scala编程

    Scala基础语法、Scala中面向对象编程、Scala中的模式匹配、Scala中的actor介绍、Actor实战、Scala中的高阶函数、隐式转换和隐式参数、Akka编程实战

    Spark

    Spark概述、Spark集群安装、Spark HA高可用部署、Spark程序、RDD概述 、创建RDD 、RDD常用的算子操作 、RDD的依赖关系、RDD的缓存机制 、DAG的生成 、spark检查点、Spark SQL概述 、DataFrame介绍以及与RDD对比 、DataFrame常用操作 、DataSet的介绍、以编程方式执行Spark SQL查询、Spark on Yarn介绍、sparkStreaming概述、Spark Streaming原理 、DStream相关操作、Dstream操作实战、sparkStreaming整合flume实战、sparkStreaming整合kafka实战

    Hbase

    hbase简介、hbase部署、hbase基本操作、hbase的过滤器、hbase原理、hbase高阶

    市场价值 : 能够胜任Spark相关工作,包括ETL工程师、Spark工程师、Hbase工程师

    阶段六 : 大数据 Spark 项目实战

    9.42
    小时

    |

    7
    知识要点

    用户画像

    用户画像概述、用户画像建模、用户画像环境、用户画像开发、hive整合hbase、hbase集成phoenix、项目可视化

    市场价值 : 能够胜任Spark相关工作,包括ETL工程师、Spark工程师、Hbase工程师、用户画像系统工程师、数据分析师

    阶段七 : Flink 实时计算系统

    20.41
    小时

    |

    21
    知识要点

    Flink

    Flink入门、Flink进阶、Flink电商项目

    市场价值 : 能够胜任Flink相关工作,包括ETL工程师、Flink工程师、大数据实时开发工程师

    阶段八 : 机器学习

    40.07小时

    |

    14
    知识要点

    机器学习入门

    机器学习概念入门、机器学习数学基础

    机器学习语言基础之Python语言

    机器学习语言基础之Python语言(上)、机器学习语言基础之Python语言(下)

    Python数据分析库实战

    Python数据分析库实战(上)、Python数据分析库实战(下)

    用户画像标签预测实战

    用户画像标签预测实战

    集成学习算法

    集成学习算法

    构建人才(用户)流失模型

    数据挖掘项目:构建人才(用户)流失模型

    推荐系统

    推荐系统入门、推荐案例实战(上)、推荐案例实战(下)

    CTR点击率预估实战

    CTR点击率预估实战

    机器学习面试必备

    机器学习面试必备

    市场价值 : 能够胜任机器学习、数据挖掘等相关工作,包括推荐算法工程师、数据挖掘工程师、机器学习工程师,填补人工智能领域人才急剧增长产生的缺口

    网站流量日志分析

    随着大数据时代的到来,各行各业产生的数据呈爆发式增长,大数据的技术从之前的“虚无”变成可能,数据产生的各种潜在价值慢慢的被挖掘出来并运用在各行各业。比如网站流量数据统计分析,可以帮助网站管理员、运营人员、推广人员等实时获取网站流量信息,并从流量来源、网站内容、网站访客特性等多方面提供网站分析的数据依据,从而帮助提高网站流量,提升网站用户体验,让访客更多的沉淀下来变成会员或客户,通过更少的投入获取最大化的收入

    路由器数据监控

    随着路由器上网的普及,越来越多的人在各个场合选择使用路由器上网,特别是在一些公共场所,因此公共场所的网络安全日益受到各地网安的关注,各种问题也日益凸显,因此急需项目中路由器监控的功能,需要做到实时的网页内容监控、地理位置的监控、上网设备的mac地址追踪,通过嗅探设备,实现上网设备的实时路线追踪

    用户画像

    大数据时代已经到来,企业迫切希望从已经积累的数据中分析出有价值的东西,而用户行为的分析尤为重要。利用大数据来分析用户的行为与消费习惯,可以预测商品发展的趋势,从而提高产品质量和用户满意度常见的用户画像系统包括以下几类:1 微信用户大数据画像2 微博群体大数据画像3 金融客户大数据画像

    数据挖掘项目-构建人才(用户)流式模型

    人才(用户)流失模型通过挖掘公司内部人力资源系统数据,对数据进行基本的预处理、各维度数据分析,得到分类特征较好的特征数据,然后对数值型数据、类别型数据、有序型数据分别进行处理和分析,使用label encoder和 one encoder对类别数据进行特征编码、组合后的特征数据形成特征向量,通过python的Scikit-team机器学习库的机器学习算法寻找数据之间存在的关系,从而为公司人力资源及决策层提供信息建议及决策建议

    日志监控告警系统

    随着公司业务发展,支撑公司业务的各种系统越来越多,为了保证公司的业务正常发展,急需要对这些线上系统的运行进行监控,做到问题的及时发现和处理,最大程度减少对业务的影响,因此项目中日志监控的功能显得至关重要。例如系统中出现任何异常,触发任何的告警规则,都可以实时通过短信或者邮件告知相关系统负责人

    Q1

    学习本课程是否需要编程基础?

    本课程内容面向Java编程基础的学员设计

    A

    还有问题,点击咨询