在线客服
扫描二维码
下载博学谷APP
扫描二维码
关注博学谷微信公众号
意见反馈

原创大数据面试题 Hive数仓开发的基本流程

发布时间：2019-07-15 16:07:11 浏览 13333 来源：博学谷资讯作者：照照

数据仓库是面向主题的、集成的、不可更新的、随时间的变化而不断变化的，这些特点决定了数据仓库的系统设计不能采用同开发传统的OLTP数据库一样的设计方法。数据仓库的设计大体上可以分为以下几个步骤：概念模型设计、技术准备工作、逻辑模型设计、物理模型设计、数据仓库生成、数据仓库运行与维护。下面我们来看看Hive数仓开发的基本流程。

<a href = 'https://www.boxuegu.com/news/data/' target='_blank' style='color: #466de2;font-size: 14px'>大数据</a>面试题 Hive数仓开发的基本流程

1.从业务系统获取数据

Sqoop 导入数据库的数据：spoop 可以在 Hive 与传统的数据库间进行数据的传递，可以将一个关系型数据库中的数据导进到 Hadoop 的HDFS中，也可以将 HDFS 的数据导进到关系型数据库中。

Flume 采集文本数据：Flume 可以将各类型的文件进行采集，存放入 hdfs中。

Ftp 文件服务器：从文件服务器上下载分析所需的源数据（增量数据、全量数据）。

2.数据存储

数据仓库分层 ods 层、dw 层、da 层：

源数据层 ODS ：直接引用外围的数据没有统一格式化的不会直接应用使用不利于分析。

数据仓库层 DW ：来自于 ODS 要经过 ETL 的过程格式统一数据规整干净清洁。

数据应用层 DA ：要去用 DW 层数据真正的数据使用者。

数据集市：也叫数据市场，数据集市就是满足特定的部门或者用户的需求，按照多维的方式进行存储，包括定义维度、需要计算的指标、维度的层次等，生成面向决策分析需求的数据立方体。

3.配置调度系统

4.导出数据&展示

以上就是小编整理的有关大数据面试题之Hive数仓开发的基本流程，都是干货，小伙伴赶紧掌握吧！

大数据面试

— 申请免费试学名额 —

在职想转行提升，担心学不会？根据个人情况规划学习路线，闯关式自适应学习模式保证学习效果
讲师一对一辅导，在线答疑解惑，指导就业！

上一篇：揭秘数据分析究竟在企业经营中有什么实际作用？下一篇：大数据对企业的意义是什么？有哪些大数据经典案例？

相关推荐 更多

大数据Hbase面试宝典（上）

经历了水深火热的大数据学习，终于拨开云雾见天明了，同学们离成功就差了一步，那就是拿到大数据工程师的Offer。本文详细为同学们整理了一份大数据Hbase面试宝典。

9510

2019-07-03 19:05:17

大数据面试
大数据Hbase面试宝典（中）

应广大同学的需求，本文继续整理了大数据HBase面试问题，希望大家阅读本篇文章以后有所收获，能够对大数据技术的理解更加深入和全面。

11030

2019-07-04 13:58:56

大数据面试
大数据面试题 Hadoop/MapReduce，Spark，Strom，Hive 的特点及适用场景

随着移动互联网的发展，云计算大数据开发求职者越来越多，面对如此激烈的市场竞争，小编特为大家整理了大数据面试题：Hadoop/MapReduce，Spark，Strom，Hive 的特点及适用场景。

10958

2019-07-09 15:08:42

大数据面试
大数据面试题 Hadoop的联邦机制

大数据学习需要掌握很多技术知识点，包括Linux、Zookeeper、Hadoop、Redis、HDFS、MapReduce、Hive、lmpala、Hue、Oozie、Storm、Kafka、Spark、Scala、SparkSQL、Hbase、Flink、机器学习等。今天主要和大家分享一下Hadoop的联邦机制。

15448

2019-07-18 23:40:42

大数据开发大数据面试
大数据Hbase经典面试题汇总

本文是根据市场需求和许多程序员面试的反馈而整理出来的，里面汇总了近些年来有关Hbase知识点的大数据经典面试题。希望本文能帮助求职者梳理Hbase知识点，让求职者在面试过程中胸有成竹。

11601

2019-08-05 19:10:38

大数据开发大数据面试