在线客服
扫描二维码
下载博学谷APP扫描二维码
关注博学谷微信公众号
相信大数据学习者对于数据仓库与数据库并不陌生,两者都是通过数据库软件实现存放数据的地方,从这个意义上来看,它们似乎没有多大的差别。但是再深入一点分析,我们会发现无论是从数据量还是作用来讲,两者的区别都是巨大的。为了更清楚的分辨数据仓库与数据库,下面我们具体来聊聊数据仓库与数据库的区别。
1、概念不同
数据库是一种逻辑概念,用来存放数据的仓库,通过数据库软件来实现。数据库由很多表组成,表是二维的,一张表里面有很多字段。字段一字排开,对数据就一行一行的写入表中。数据库的表,在于能够用二维表现多维的关系。而数据仓库是数据库概念的升级,从数据量来说,数据仓库要比数据库更庞大德多。数据仓库主要用于数据挖掘和数据分析,辅助领导做决策。
2、本质不同
数据库与数据仓库的区别实际讲的是OLTP与OLAP的区别。操作型处理,叫联机事务处理OLTP,它是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。用户较为关心操作的响应时间、数据的安全性、完整性和并发支持的用户数等问题。传统的数据库系统作为数据管理的主要手段,主要用于操作型处理。而分析型处理,叫联机分析处理OLAP一般针对某些主题的历史数据进行分析,支持管理决策。
3、作用不同
我们要明白,数据仓库与数据库虽然有所区别,但是并表代表谁就一定比谁要好,数据仓库的出现并不是要取代数据库。数据库是面向事务的设计,数据仓库是面向主题设计的。数据库一般存储业务数据,数据仓库存储的一般是历史数据。
4、设计不同
数据库设计是尽量避免冗余,一般针对某一业务应用进行设计,比如一张简单的User表,记录用户名、密码等简单数据即可,符合业务应用,但是不符合分析。而数据仓库在设计是有意引入冗余,依照分析需求,分析维度、分析指标进行设计。简单来说,数据库是为捕获数据而设计,数据仓库是为分析数据而设计。
5、应用场景不同
以银行业务为例。数据库是事务系统的数据平台,客户在银行做的每笔交易都会写入数据库,被记录下来,这里可以简单地理解为用数据库记账。有所区别的是,数据仓库是分析系统的数据平台,它从事务系统获取数据,并做汇总、加工,为决策者提供决策的依据。比如,某银行某分行一个月发生多少交易,该分行当前存款余额是多少。如果存款又多,消费交易又多,那么该地区就有必要设立ATM了。
显然,银行的交易量是巨大的,通常以百万甚至千万次来计算。事务系统是实时的,这就要求时效性,客户存一笔钱需要几十秒是无法忍受的,这就要求数据库只能存储很短一段时间的数据。而分析系统是事后的,它要提供关注时间段内所有的有效数据。这些数据是海量的,汇总计算起来也要慢一些,但是只要能够提供有效的分析数据就达到目的了。
总之,数据仓库与数据库虽然都可以存放数据,但是数据仓库是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,它决不是所谓的“大型数据库”。两者既相互区别,又相辅相成,少了谁都不行!
— 申请免费试学名额 —
在职想转行提升,担心学不会?根据个人情况规划学习路线,闯关式自适应学习模式保证学习效果
讲师一对一辅导,在线答疑解惑,指导就业!
相关推荐 更多
互联网医疗大数据商业变现应用
互联网医疗大数据商业变现应用,2018年《国家健康医疗大数据标准、安全、服务管理办法(试行)》正式出炉,与以往政策不同,该规定不再停留于宏观指导层面,而是对医疗大数据标准、安全、服务中的权责利进行了详细规定。
8173
2019-04-18 18:12:28
Spark运行架构及其特点讲解
Spark应用程序以进程集合为单位在分布式集群上运行,通过driver程序的main方法创建的SparkContext对象与集群交互。本文主要内容有Spark运行架构的流程讲解和Spark运行架构的特点分析,感兴趣的小伙伴就赶紧看下去吧!
7060
2019-08-20 19:22:54
云计算大数据在线培训班靠不靠谱?
如今,云计算和大数据已经成为了未来的发展趋势。在时代潮流的要求下,不少人纷纷想进入云计算大数据行业,然而自学难度大、时间长、效率低,那么到底应该如何进入该行业呢?参加云计算大数据在线培训班可以说是一个有效的方法。然而,也有不少人会担心,云计算大数据在线培训班靠不靠谱?下面小编将从课程内容、师资力量和教学方式,为大家全面分析一下云计算大数据在线培训班。
6449
2019-12-30 21:18:38
如何安装Kafka?新手安装教程指导
Kafka是由Java编写的一个开源流处理平台,因为它强大的动作流数据处理功能而备受大数据开发者的欢迎。因而作为大数据的开发者,掌握Kafka也就掌握了大数据最重要的一项核心技术。本文是一篇新手入门Kafka的安装教程,下面小编将手把手结合图片详细的指导大家安装Kafka。
4116
2020-02-17 14:41:36
什么是数据科学异常值检测原理?
什么是数据科学异常值检测原理?异常值的检测方法有基于统计的方法,基于聚类的方法,以及一些专门检测异常值的方法等。使用pandas,可以直接使用describe()来观察数据的统计性描述,或者简单使用散点图也能很清晰的观察到异常值的存在。
7315
2020-03-20 16:21:07