在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
Hive是建立在Hadoop上的数据仓库基础构架,它提供了一系列的工具,可以用来进行数据提取转化加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类 SQL 查询语言,它允许熟悉SQL的用户查询数据。因此掌握Hive是学习大数据的必修课,那么掌握Hive架构需要学什么呢?本文将为大家讲述Hive的具体学习内容,下面是Hive视频教程的学习大纲:
第一章 数据管理与数据仓库
1. 数据分析系统不同数据来源
2. 数据管理--文件管理服务&跨部门文件管理规范
3. 数据管理--文件管理规范示例
4. 数据管理--数据质量检测
5. 数据仓库--基本概念&和数据库区别
6. 数据仓库--数据仓库主要特征
7. 数据仓库--数据仓库分层架构
8. 数据仓库--数据仓库元数据管理
第二章 Apache Hive介绍及安装部署
1. 介绍&Hive实现思路模拟
2. 架构&组件
3. 与RDBMS区别
4. 安装部署--内置derby版以及缺陷
5. 安装部署-mysql版安装
6. 安装部署-几种交互方式
7. 初体验-理解什么是映射
第三章 Apache Hive—DDL
1. DDL--创建表--数据类型&分隔符
2. DDL--创建表--默认分隔符
3. DDL--创建表--分区表创建
4. DDL--创建表--双分区表&小结
5. DDL--创建表--分桶表创建&分桶数据导入
6. DDL--创建表--分桶表总结&分桶表好处
7. DDL--创建表--内外部表&like复制
8. DDL--修改表&显示命令
第四章 Apache Hive—DML
1. DML--load装载数据
2. DML--insert&多重插入&动态分区
3. DML--导出数据
4. DML--select查询
第五章 Apache Hive—函数及其他操作
1. join操作
2. 命令行&参数配置方式
3. 内置运算符函数&dual测试方式
4. 自定义函数UDF开发
5. 了解transform
6. 特殊分隔符处理
总而言之,该课程适合有一定大数据基础的学员进行学习。在完成上面的学习大纲后,大家就可以在hive上建立企业自己的数据数仓平台,还能针对企业自己的业务实现自己的UDF函数。大家还在等什么?现在就在下方填写课程试听申请,立即就能获取相应的视频课程在线学习!
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
怎样学习spark
现在一提到云计算大数据,就会想到spark。要怎样学习spark呢?首先我们需要简单了解一下它:Spark 是一种与 Hadoop 相似的开源集群计算环境,甚至在某些工作负载方面表现得更加优越。Spark采用一个统一的技术堆栈解决了云计算大数据的如流处理、图技术、机器学习、NoSQL查询等方面的所有核心问题,具有非常完善的生态系统,这直接奠定了其一统云计算大数据领域的霸主地位;
7016
2019-08-06 10:20:49
云计算大数据在线培训班课程贵吗?
云计算大数据的前景是十分广阔的,许多公司都很重视大数据,从各个公司提出的诱人薪资待遇,我们便可窥见一二。但是,有些参加云计算大数据在线培训班的同学不免担心,培训机构的学习内容能不能在工作中得到应用。所以云计算大数据在线培训班应用而生,相信不少人又想问,云计算大数据在线培训班课程贵吗?
8111
2019-12-16 19:23:11
大数据面试题之分布式资源调度框架Yarn
Yarn作为一个资源管理、任务调度的框架,其重要性不言而喻。尤其是在近些年的大数据面试中,更是面试题的重点知识之一。为了大家在面试的时候,能够准备的更加充分,小编整理了一份有关分布式资源调度框架Yarn的大数据面试题,内容包括Yarn的架构、工作流程、调度器Scheduler。
7745
2019-09-12 11:00:53
大数据培训比较好的机构有哪些?
大数据培训比较好的机构有哪些?一般来讲,比较好的IT培训机构都集中在一二线大城市,无论是师资力量还是就业机会在北上广深这样的一线城市会更多。当然,虽然一线城市的IT培训机构多不胜数,但是真的想要找一个好的大数据培训机构是比较困难的,这里就为大家分别推荐一个线下和线上的大数据培训机构,感兴趣的小伙伴可以参考一下。
6352
2020-05-26 15:12:38
元数据是什么?它有什么用?
在大家接触到数据仓库管理系统的学习之后,有一个绕不开的知识点就是元数据。那么,元数据是什么?它有什么用呢?简单来讲,元数据就是描述数据的数据,它的作用就是维护数据仓库。如果大家还不明白,可以看看下面更加具体的解释~
7865
2020-06-05 15:36:25