在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
Hadoop简称HDFS,它具有高容错性的特点,并且适合那些有着超大数据集的应用程序。Hadoop中的分布式计算框架,使的分布式编程更简单,能够很好的处理存储在hdfs上的海量数据。因此如果大家要入门学习大数据,Hadoop是必须掌握的内容。下面我们一起来看看大数据hadoop入门课程大纲:
第一章 Apache Hadoop简介
Hadoop介绍
Hadoop发展简史
Hadoop特性优点&国内外应用
第二章 Apache Hadoop—集群搭建
集群搭建--发行版本&集群简介
集群搭建--服务器环境准备
集群搭建--JDK环境安装
集群搭建--安装包目录结构
集群搭建--配置文件修改上
集群搭建--配置文件修改下
集群搭建--配置文件注意事项
集群搭建--namenode格式化
集群搭建--启动方式
集群搭建--集群ui&初体验
第三章 Apache Hadoop—HDFS
HDFS--介绍&模拟实现思路
HDFS--设计目标
HDFS--重要特性
HDFS--shell客户端
HDFS--shell常用命令介绍
HDFS基本原理--NameNode概述
HDFS基本原理--DataNode概述
HDFS工作机制--概述
HDFS工作机制--写数据流程--上
HDFS工作机制--写数据流程--下
HDFS工作机制--读数据流程
HDFS应用开发--JAVA api环境&对象
HDFS应用开发--创建目录&客户端身份设置
HDFS应用开发--下载文件&本地hadoop环境配置
HDFS应用开发--其他api&Stream操作
案例:shell定时采集数据至hdfs--需求分析
案例:shell定时采集数据至hdfs--实现
第四章 Hadoop MapReduce
理解MapReduce思想
MapReduce计算模拟实现思路
MapReduce设计构思
MapReduce框架结构&编程规范
WordCount案例--Mapper编写:mr数据类型
WordCount案例--Mapper编写:map方法
WordCount案例--Reducer编写:类型确定&如何调用
WordCount案例--Reducer编写:reduce方法编程
WordCount案例--运行主类Job编程
程序运行模型--集群运行模式
程序运行模型--本地运行模式
MapReduce的输入和输出
第五章 MapReduce数据分区&分区规则及编程案例
理解MapReduce思想
MapReduce计算模拟实现思路
MapReduce设计构思
MapReduce框架结构&编程规范
WordCount案例--Mapper编写:mr数据类型
WordCount案例--Mapper编写:map方法
WordCount案例--Reducer编写:类型确定&如何调用
WordCount案例--Reducer编写:reduce方法编程
WordCount案例--运行主类Job编程
程序运行模型--集群运行模式
程序运行模型--本地运行模式
MapReduce的输入和输出
第六章 Apache Flume概述及案例讲解
概述&运行机制
安装部署&netcat-logger
案例--采集目录至HDFS
案例--spooldir使用注意事项
案例--采集文件至HDFS
高级功能--load balance
高级功能--failover
实战案例--采集日志汇总&拦截器使用
扩展了解--自定义拦截器思路
完成了大数据hadoop入门课程大纲的学习,大家可以在快速了解hadoop的同时,学会hadoop集群中的文件存储功能.分布式编程框架,还能了解离线大数据处理的基本流程。如果大家对课程感兴趣,还等什么,现在就来体验相关免费课程吧~
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
大数据培训班实战项目介绍
本文将为大家介绍博学谷大数据培训班中的实战项目,一直以来该培训班的课程都是用案例驱动教学,将真实实例贯穿到知识点中,让学员在学中练、练中学,真正做到及时训练、及时强化,从而使学员可以更快掌握大数据实战技术。下面我们就来看看大数据培训班的六大实战项目吧~
5246
2020-05-05 15:28:48
Flink电商项目实战介绍
随着Flink技术的飞速发展,Flink在实时处理数据方面体现出越来越显著的优势。Flink作为一个针对流数据和批数据的分布式处理引擎,其应用领域越来越广泛。本文将向大家介绍Flink电商项目实战教程,感兴趣的话就一起接着看下去吧~
4561
2020-05-11 14:58:14
掌握Hive架构需要学什么?
Hive是建立在Hadoop上的数据仓库基础构架,它提供了一系列的工具,可以用来进行数据提取转化加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类 SQL 查询语言,它允许熟悉SQL的用户查询数据。因此掌握Hive是学习大数据的必修课,那么掌握Hive架构需要学什么呢?本文将为大家讲述Hive的具体学习内容,下面是Hive视频教程的学习大纲:
4460
2020-05-11 18:05:41
什么人适合学习大数据开发?学大数据难吗?
有不少应届大学毕业生和0基础人群选择学大数据,但是要选择零基础的大数据培训班,从Java基础开始学习,由浅入深掌握离线数据分析、实时数据分析和内存数据计算等重要内容。
4002
2020-11-26 15:20:18
Sequence File格式是什么?如何使用?
Hadoop可以存储多种文件格式。sequenceFile文件是Hadoop用来存储二进制形式的[Key,Value]对而设计的一种平面文件(Flat File)。可以把SequenceFile当做是一个容器,把所有的文件打包到SequenceFile类中可以高效的对小文件进行存储和处理。
4719
2021-03-16 13:59:21