在线客服
扫描二维码
下载博学谷APP
扫描二维码
关注博学谷微信公众号
在大家接触到数据仓库管理系统的学习之后,有一个绕不开的知识点就是元数据。那么,元数据是什么?它有什么用呢?简单来讲,元数据就是描述数据的数据,它的作用就是维护数据仓库。如果大家还不明白,可以看看下面更加具体的解释~

1、定义
元数据又叫中介数据,或是中继数据,为描述数数据的数据,主要是描述数据属性的信信息,用来支持如指示存储位置、历历史数据、资资查找、文件记录等功能。元数据算是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。它也是数据仓库管理系统的重要组成部分,元数据管理是企业级数据仓库中的关键组件,贯穿数据仓库构建的整个过程,直接影响着数据仓库的构建、使用和维护。
2、元数据的作用
元数据主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及ETL的任务运行状态。一般会通过元数据资料库来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、操作和管理能达成协同和一致。
构建数据仓库的主要步骤之一是ETL。这时元数据将发挥重要的作用,它定义了源数据系统到数据仓库的映射、数据转换的规则、数据仓库的逻辑结构、数据更新的规则、数据导入历史记录以及装载周期等相关内容。数据抽取和转换的专家以及数据仓库管理员正是通过元数据高效地构建数据仓库。用户在使用数据仓库时,通过元数据访问数据,明确数据项的含义以及定制报表。数据仓库的规模及其复杂性离不开正确的元数据管理,包括增加或移除外部。
3、元数据的分类
元数据可分为技术元数据和业务元数据。技术元数据为开发和管理数据仓库的IT 人员使用,它描述了与数据仓库开发、管理和维护相关的数据,包括数据源信息、数据转换描述、数据仓库模型、数据清洗与更新规则、数据映射和访问权限等。而业务元数据为管理层和业务分析人员服务,从业务角度描述数据,包括商务术语、数据仓库中有什么数据、数据的位置和数据的可用性等,帮助业务人员更好地理解数据仓库中哪些数据是可用的以及如何使用。
关于元数据是什么,看到这里的朋友应该都有所了解了。元数据不仅定义了数据仓库中数据的模式、来源、抽取和转换规则等,而且是整个数据仓库系统运行的基础,元数据把数据仓库系统中各个松散的组件联系起来,组成了一个有机的整体。
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
大数据技术就业前景好不好?
大数据技术就业前景好不好?现如今,大数据应用非常广泛,各行各业都开始应用,所以说当前大数据行业真的是人才稀缺尤其是数据分析人才最稀缺。所以让小编跟你说一说,目前大数据行业的大概情况吧。
5970
2020-03-26 22:21:32
大数据课程有哪些新增内容和升级更新?
距离传智播客在2012年发布的第一版大数据课程,已经整整八年了。在这期间,大数据行业发生了翻天覆地的变化,为了不断适应行业的发展和市场变更,大数据学科随时准备着让课程保持同步更新迭代,始终奔跑在行业前沿。下面我们一起来看看大数据课程有哪些新增内容和升级更新。
6207
2020-07-16 11:21:10
大数据开发离线计算框架知识点总结
大数据开发离线计算框架知识点总结,大数据在带来发展机遇的同时,也带来了新的挑战,催生了新技术的发展和旧技术的革新。大数据离线计算技术应用于静态数据的离线计算和处理,框架设计的初衷是为了解决大规模、非实时数据计算,更加关注整个计算框架的吞吐量。
7064
2020-07-16 16:41:14
大数据对教育行业重要作用有哪些?
大数据通过更好的决策、评估和增强的学习成果影响教育体系,有助于教育工作者跟踪学生的表现,并为其提供更好的学习环境。学生将不再受到静态学习计划的限制。若教育工作者广泛采用大数据系统,能够将学习过程提高到一个新水平。
11342
2021-02-04 15:16:33
大数据Storm分布式实时处理框架是什么?用在哪儿?
大数据Storm分布式实时处理框架是什么?用在哪儿?Storm是Twitter开源的分布式实时大数据处理框架,是一个免费的开源分布式实时计算系统,使用起来比较简单可以与任何编程语言一起使用。Apache Storm有很多用例如实时分析、在线机器学习、连续计算、分布式RPC、ETL等。
4884
2022-03-01 14:13:44
