学完该课程,将 熟悉掌握大数据开发思维,掌握jvm优化 熟悉掌握hdfs的开发应用以及原理 熟悉掌握MapReduce运行原理及程序开发能力 熟悉掌握hive数据仓库的开发 熟悉掌握HBASE列式数据库优化及开发 熟悉掌握azkaban、impala、oozie、hue、zookeeper等Hadoop生态圈组件 熟悉掌握分布式消息中间件kafka的原理及应用 熟悉掌握storm流计算编程原理以及企业级应用 熟悉掌握Scala编程知识 熟悉掌握spark内存计算的搭建使用及运行原理 熟悉掌握sparksql、sparkteaming等spark一站式开发框架的应用

【季度铂金会员】云计算大数据高级就业课

完成高级课程能够胜任离线相关工作,包括ETL工程师、任务调度工程师、Hive工程师、数据仓库工程师,能够胜任Spark相关工作,包括ETL工程师、Spark工程师、Hbase工程师、用户画像系统工程师、大数据反欺诈工程师。目前企业急缺Spark相关人才,能够胜任机器学习、数据挖掘等相关工作,包括推荐算法工程师、数据挖掘工程师、机器学习工程师,填补人工智能领域人才急剧增长缺。

课程时长:200课时 学习人数:123人 有效期:90天

教学服务服务期: 90天

  • 随到随学
  • ¥2698.00 ¥4999.00

    阶段一  会员版(2.1)-大数据基础增强

    本阶段重点讲解 Linux 操作基础、 Shell 编程、 Zookeeper 集群和 hadoop 集群环境准备等内容,可以帮助没有 Linux 基础 或者 Linux 基础薄弱的学员, 达到熟练使用 Linux、熟练安装 Linux 上的软件,熟悉负载均衡、高可靠等集群相关概念,搭建 互联网高并发、高可靠的服务架构, 为大数据内容的深入学习做好充足的准备。

    第一章:  会员版(2.1)-Linux实战

    1-1 linux_概述_安装_常用命令
    1-2 linux_打包压缩_vim编辑器_系统管理_用户权限
    1-3 linux_管道_shell编程

    第二章:  会员版(2.0)-就业课(2.0)-JVM优化(上)

    2-1 JVM优化1

    第三章:  会员版(2.0)-就业课(2.0)-JVM优化(中)

    3-1 JVM优化2

    第四章:  会员版(2.0)-就业课(2.0)-JVM优化(下)

    4-1 JVM优化3

    阶段二  会员版(2.1)-大数据 Hadoop 离线分布式系统

    大数据 Hadoop 离线分布式系统

    第一章:  会员版(2.1)-大数据基础和 硬件介绍

    1-1 大数据预备知识
    1-2 集群Linux环境搭建和Shell脚本

    第二章:  会员版(2.1)-Zookeeper

    2-1 Zookeeper

    第三章:  会员版(2.1)-HDFS组件

    3-1 hadoop概述_架构_安装
    3-2 Hadoop 核心-HDFS

    第四章:  会员版(2.1)-MapReduce组件

    4-1 MapReduce 概述_架构_编写流程
    4-2 MapReduce-排序和序列化
    4-3 mapreduce统计求和案例
    4-4 mapreduce运行机制
    4-5 mapreduce 实现Reduce以及map端 join
    4-6 mapreduce 求共同好友案例
    4-7 自定义输入和输出组件实现
    4-8 topn案例

    第五章:  会员版(2.1)-Yarn组件

    5-1 yarn资源调度

    第六章:  会员版(2.1)-Hive组件

    6-1 hive 数据仓库
    6-2 hive查询以及调优

    第七章:  会员版(2.1)-Impala组件

    7-1 Impala

    第八章:  会员版(2.1)-辅助系统工具

    8-1 Sqoop
    8-2 Flume
    8-3 azkaban
    8-4 Oozie
    8-5 Hue

    第九章:  会员版(2.1)-网站流量日志分析

    9-1 网站流量日志分析_架构_埋点采集
    9-2 网站流量日志分析-数据预处理
    9-3 网站流量日志分析-数仓设计-模型设计-指标分析
    9-4 网站流量日志分析-多维统计
    9-5 网站流量日志分析-窗口函数-统计分析
    9-6 网站流量日志分析-调度-可视化

    阶段三  会员版(2.1)-大数据 NoSQL、Kafka和ELK技术实战

    掌握NoSQL数据库的特点和应用场景; 掌握Hbase的应用场景和核心原理; 掌握Hbase的RowKey设计的策略; 掌握Hbase常用的性能优化手段; 掌握分布式数据发布和订阅的工具Kafka; 掌握Kafka工具的使用和性能优化; 掌握ELK技术栈(end-to-end)的应用场景; 掌握Logstash数据抽取、清洗,ElasticSearch分布式检索,Kibana数据展示的应用。

    第一章:  会员版(2.1)-redis组件

    1-1 redis组件

    第二章:  会员版(2.1)-hbase组件

    2-1 hbase架构以及读写操作
    2-2 hbase集成mapredce以及hbase优化
    2-3 基于hbase实现微博用户关系梳理案例

    第三章:  会员版(2.1)-kafka组件

    3-1 kafka

    第四章:  会员版(2.1)-ELK技术栈

    4-1 Elasticsearch的功能、架构和原理
    4-2 es搜索聚合操作以及logstash采集和kibana可视化
    4-3 es整合hbase案例

    阶段四  会员版(2.1)-大数据 Spark 内存计算系统

    掌握分布式内存计算的思想; 掌握Spark分布式计算的架构和思想; 掌握Spark和Mapreduce分布式计算框架的比较和区别; 掌握Spark的RDD、DAG、Task、Partition等设计思想; 掌握Spark SQL的功能、SparkSQL+Hive的整合; 掌握DataFrame、DataSet的编程模型; 掌握Structured Streaming的应用场景和与Kafka的整合; 掌握MLlib数据挖掘的思想和GraphX图计算的思想; 掌握Spark技术栈的高级特性和性能调优的能力

    第一章:  会员版(2.1)-Scala语言

    1-1 scala_语法基础
    1-2 scala_类_对象
    1-3 scala_模式匹配_异常处理
    1-4 scala_高阶函数

    第二章:  会员版(2.1)-Spark入门以及集群搭建

    2-1 Spark入门以及集群搭建

    第三章:  会员版(2.1)-spark_rdd算子

    3-1 RDD_定义_转换算子
    3-2 RDD_action算子_分区_缓存

    第四章:  会员版(2.1)-Spark原理_运行过程_高级特性

    4-1 Spark原理_运行过程_高级特性

    第五章:  会员版(2.1)-sparksql

    5-1 SparkSQL_使用场景_优化器_Dataset
    5-2 SparkSQL读写_hive_mysql_案例
    5-3 Dataset (DataFrame) 的基础操作
    5-4 SparkSQL_聚合操作_连接操作
    5-5 SparkSQL_出租车利用率分析案例

    第六章:  会员版(2.1)-SparkStreaming原理_运行过程_高级特性

    6-1 SparkStreaming_原理_案例

    第七章:  会员版(2.1)-Structured Streaming_介绍_案例

    7-1 Structured Streaming_介绍_案例

    阶段五  会员版(2.1)-大数据 Spark 内存计算系统项目实战

    大数据 Spark 内存计算系统项目实战

    第一章:  会员版(2.1)-Kudu入门_项目介绍_ CDH搭建

    1-1 Kudu入门_原理_ CDH搭建

    第二章:  会员版(2.1)-Kudu_javaApi使用_Spark整合

    2-1 Kudu_javaapi使用_Spark整合

    第三章:  会员版(2.1)-DMP项目_业务介绍_框架搭建

    3-1 DMP项目_业务介绍_框架搭建

    第四章:  会员版(2.1)-DMP项目_IP转换_报表统计

    4-1 DMP项目_IP转换_报表统计

    第五章:  会员版(2.1)-DMP项目_实现商圈库功能

    5-1 DMP项目_实现商圈库功能

    第六章:  会员版(2.1)-DMP项目_统一识别

    6-1 DMP项目_统一识别

    阶段六  会员版(2.1)-大数据 flink 实时计算系统

    掌握分布式实数计算框架架构和思想; 掌握Flink、Spark和MapReduce的区别; 掌握Flink流式计算的功能和应用; 掌握Flink SQL的使用; 掌握Flink DataStream的使用;

    第一章:  会员版(2.1)-Flink基础

    1-1 Flink基础介绍
    1-2 Flink批处理开发
    1-3 Flink流处理开发

    第二章:  会员版(2.1)-Flink 高级进阶

    2-1 Flink高级开发

    阶段七  会员版(2.1)-大数据 flink 项目实战

    解决企业里面海量数据对实时性要求要的数据分析和应用; 解决Flink企业级应用常见的优化技巧和手段。

    第一章:  会员版(2.1)-Flink电商指标分析项目

    1-1 项目简介以及上报服务系统开发
    1-2 Flink整合kafka开发
    1-3 HBaseUtil工具类开发
    1-4 实时数据业务分析开发
    1-5 实时数据同步系统开发
    1-6 Flink离线分析系统开发

    阶段八  会员版(2.1)-大数据新技术实战详解

    掌握Druid的功能和应用场景;

    第一章:  会员版(2.1)-druid

    1-1 druid_集群搭建_架构
    1-2 druid_数据查询_广告点击项目案例开发

    阶段九  会员版(2.0)-机器学习 (拓展课程)

    机器学习 (拓展课程)

    第一章:  就业课(2.0)-机器学习入门

    1-1 机器学习概念入门
    1-2 机器学习数学基础

    第二章:  会员版(2.0)-就业课(2.0)-机器学习语言基础之Python语言

    2-1 机器学习语言基础之Python语言(上)
    2-2 机器学习语言基础之Python语言(下)

    第三章:  会员版(2.0)-就业课(2.0)-Python数据分析库实战

    3-1 Python数据分析库实战(上)
    3-2 Python数据分析库实战(下)

    第四章:  会员版(2.0)-就业课(2.0)-用户标签预测项目实战

    4-1 用户画像标签预测实战
    4-2 集成学习算法
    4-3 数据挖掘项目:构建人才(用户)流失模型

    第五章:  会员版(2.0)-就业课(2.0)-推荐系统

    5-1 推荐系统入门
    5-2 推荐案例实战(上)
    5-3 推荐案例实战(下)

    第六章:  会员版(2.0)-就业课(2.0)-CTR点击率预估实战

    6-1 CTR点击率预估实战

    第七章:  会员版(2.0)-就业课(2.0)-机器学习面试必备

    7-1 机器学习面试必备
    他们在学 已报名123
    1. 就业班头像
      潘立勇

      2019-03-29 14:17:17 在学习

    2. 就业班头像
      bxg_69516

      2019-03-29 14:15:07 在学习

    3. 就业班头像
      bxg_39712

      2019-03-29 14:05:00 在学习

    4. 就业班头像
      bxg_70329

      2019-03-29 13:55:57 在学习

    5. 就业班头像
      bxg_12339

      2019-03-29 13:51:54 在学习

    6. 就业班头像
      bxg_52270

      2019-03-29 13:49:50 在学习

    7. 就业班头像
      bxg_12841

      2019-03-29 13:45:45 在学习

    8. 就业班头像
      bxg_62784

      2019-03-29 13:37:42 在学习

    9. 就业班头像
      bxg_30940

      2019-03-29 13:32:40 在学习

    10. 就业班头像
      bxg_41099

      2019-03-29 13:29:39 在学习