在线客服
扫描二维码
下载博学谷APP
扫描二维码
关注博学谷微信公众号
Hive是建立在Hadoop上的数据仓库基础构架,它提供了一系列的工具,可以用来进行数据提取转化加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类 SQL 查询语言,它允许熟悉SQL的用户查询数据。因此掌握Hive是学习大数据的必修课,那么掌握Hive架构需要学什么呢?本文将为大家讲述Hive的具体学习内容,下面是Hive视频教程的学习大纲:

第一章 数据管理与数据仓库
1. 数据分析系统不同数据来源
2. 数据管理--文件管理服务&跨部门文件管理规范
3. 数据管理--文件管理规范示例
4. 数据管理--数据质量检测
5. 数据仓库--基本概念&和数据库区别
6. 数据仓库--数据仓库主要特征
7. 数据仓库--数据仓库分层架构
8. 数据仓库--数据仓库元数据管理
第二章 Apache Hive介绍及安装部署
1. 介绍&Hive实现思路模拟
2. 架构&组件
3. 与RDBMS区别
4. 安装部署--内置derby版以及缺陷
5. 安装部署-mysql版安装
6. 安装部署-几种交互方式
7. 初体验-理解什么是映射
第三章 Apache Hive—DDL
1. DDL--创建表--数据类型&分隔符
2. DDL--创建表--默认分隔符
3. DDL--创建表--分区表创建
4. DDL--创建表--双分区表&小结
5. DDL--创建表--分桶表创建&分桶数据导入
6. DDL--创建表--分桶表总结&分桶表好处
7. DDL--创建表--内外部表&like复制
8. DDL--修改表&显示命令
第四章 Apache Hive—DML
1. DML--load装载数据
2. DML--insert&多重插入&动态分区
3. DML--导出数据
4. DML--select查询
第五章 Apache Hive—函数及其他操作
1. join操作
2. 命令行&参数配置方式
3. 内置运算符函数&dual测试方式
4. 自定义函数UDF开发
5. 了解transform
6. 特殊分隔符处理
总而言之,该课程适合有一定大数据基础的学员进行学习。在完成上面的学习大纲后,大家就可以在hive上建立企业自己的数据数仓平台,还能针对企业自己的业务实现自己的UDF函数。大家还在等什么?现在就在下方填写课程试听申请,立即就能获取相应的视频课程在线学习!
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
大数据培训有哪些课程?
近年来大数据发展得如火如荼,许多小伙伴都加入了大数据学习的大军,大数据培训有哪些课程?成了大家谈论的话题,不管是自学大数据技术还是参加大数据培训,都要有一个好的学习方法和科学的大数据学习课程,我今天就把博学谷大数据培训课程分享给大家,希望对想要学习大数据技术的小伙伴能有所帮助。
9190
2019-07-05 13:09:48
大数据培训学校哪家好?大数据课程有什么?
大数据培训学校,博学谷实力不错,疫情期间选择博学谷大数据在线学校保证学习效果。提供全方位教学师资团队,提供全方位教学服务,保证学习效果,每个班级都有班主任老师,日常工作管理,老师在线答疑解决学生遇到的问题。
6071
2020-02-25 14:33:20
什么是数据库?用来做什么?
什么是数据库?用来做什么?我们在编程和网络经常会听到数据可这个词,作为市场调研和用户分析的重要工具,那么究竟什么是数据库?数据库是存放数据的仓库。它的存储空间很大,可以存放百万条、千万条、上亿条数据。但是数据库并不是随意地将数据进行存放,是有一定的规则的,否则查询的效率会很低。
5792
2020-06-03 14:16:12
数据仓库是什么?基本概念讲解
对于大数据的学习者来讲,深入理解数据仓库是很重要的。本文将对数据仓库的基本概念进行讲解,大家可以在看完数据仓库的概念、主要特征以及分层架构之后,真正理解数据仓库是什么。
8704
2020-06-04 11:58:15
常用的大数据实时计算框架有哪些?
在大数据技术中,有离线计算、批量计算、实时计算以及流式计算,其中,离线计算和实时计算指的是数据处理的延迟;批量计算和流式计算指的是数据处理的方式。
6068
2021-03-10 09:50:12
