• 10h

    课程时长

  • 无限期

    有效期

  • 0

    学习人数

适合人群

具有Java基础或者scala基础


课程介绍

Spark是基于内存计算的大数据分布式计算框架。Spark基于内存计算,提高了在大数据环境下数据处理的实时性,同时保证了高容错性和高可伸缩性,允许用户将Spark部署在大量廉价硬件之上,形成集群。


学完能做什么

能够基于spark平台进行离线数据处理和实时数据计算。


用途

大规模离线数据计算、实时数据计算、混合计算


前景

目前在大数据开发企业中广泛使用,提供一个大数据综合处理的平台,在逐步的替代hadoop生态圈的一些工具和stormflink等流式处理工具。Spark的社区活跃度高,并且不仅在大数据处理领域体现出了优异的性能,在机器学习、图像处理等领域都在蓬勃发展。

 

师资团队
  • 大数据高级讲师
    高级讲师
    多年JavaEE开发及编码经验,曾主导多个项目开发,熟悉SpringMVC、MyBatis、Spring等JavaWeb技术,具有多年大数据开发经验,对大数据领域中的常用框架hadoop、hive、flume、kafka、storm、spark等有丰富的实战经验和研究。授课风格严谨,课堂气氛活跃。