首页 > web新知 > 正文

数据库与数据仓库的区别

2023-09-03 14:30:49web新知阅读

数据库是数据根据需求设计的数据表的集合,而数据仓库只是储存数据的平台。数据仓库可以看成一个储存数据的仓库;而数据库是一个图书馆,储存的书是各种数据表。数据仓库,是在数据库已经大量存在的情况下,为了进一步挖掘数据资源、为了决策需要而产生的,数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。

data warehouse 数据仓库

数据仓库

数据仓库是为了满足数据分析需要设计的,存储的是经过 ETL 过程的数据,能够反映相当长一段时间内的历史数据内容,是不同时间点数据库快照的集合。

数据库

数据库是存储没有经过任何加工的原始数据的,通过数据库软件实现。数据库有很多表组成,每张表里面又有很多字段,因此能够通过表的二维来表现三维的关系。数据库在 IT 架构中是必须存在的,因为必须要有地方存数据。就拿微信、微博的账号和密码来说,在后台数据库中肯定会有一个 user 表,字段起码包括用户名和密码,然后所有的用户数据一行一行存在 user 表上面,我们登陆的时候,填写用户名和密码就会传回到后台中去与 user 表上面的数据进行匹配,匹配成功了就登陆上,不成功就报错。

数据库软件

数据库软件是一个软件,能够创建、编辑、维护、记录数据库文件,支持用户以结构化形式存储数据和访问数据。不是链接数据库的图形化客户端,而是能够提供图形界面来简化数据的创建和管理。数据库软件也称为“数据库管理系统(DBMS)”,充当数据库与其他用户或程序之间的接口,此外还提供各种管理功能,例如:性能监视、调优、备份和恢复。

数据库与数据仓库相同点:都是通过数据库软件用来存储数据的。

数据库与数据仓库区别

1.职责:数据库主要用在生产环境的,只要与业务相关的都会使用到数据库来存储数据,数据仓库是 BI 下其中一种技术,主要是用于数据挖掘和数据分析、辅助决策。

2.存储数据内容:数据库是存储未经处理加工的原始数据,都是跟业务挂钩的数据。数据仓库存储的是从分散的数据库数据中抽取出来的数据,并且数据需要经过综合处理(大多数的综合处理都是在进入数据仓库之后进行的),综合处理解决不同数据库中源数据重复和不一样的地方,包括像表字段的同名异义、异名同义、单位不统一等等。

3.类型:数据库是操作型数据库,称为联机事务处理 OLTP,针对具体业务在数据库联机的日常操作,通常对少数记录进行查询、修改。数据仓库是分析性型数据库,称为联机分析处理 OLAP,一般针对某些主题历史数据进行分析、支持管理决策。

4.数据量:数据仓库的数据量要比数据库大的多。

5.数据更新:数据库存储的数据都是随着用户操作会进行实时更新的,而数据仓库的用户在进行分析处理时不进行数据更新操作,但数据会随着时间变化而变化的(增加新的数据库快照)。

6.数据存储时间:数据库一般保存 60-90 天的数据,而数据仓库一般需要保存较长时限,例如:5-10 年。

总结:

  • 数据库是面向事务的设计,数据仓库是面向主题设计的。
  • 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据。
  • 数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引入冗余,采用反范式的方式来设计。
  • 数据库是为捕获数据而设计,数据仓库是为分析数据而设计。

猜你喜欢

  • 大数据分析师需要掌握的技能

    大数据分析师需要掌握的技能

    目前,无论是企业还是个人生活工作,都十分需要重视数据分析工作。毕竟,数据分析有助于企业和个人更好地发展。想转行做大数据分析,大数据分析师需要掌握哪些技能呢?大数据分析师必备技能1.数据可视化方面的专业知识很难处理一个复杂的主题并以

    2023-09-03
  •  
  • 什么是数据分析

    什么是数据分析

    数据分析是一种统计分析方法,是数学与计算机科学相结合的产物。通过恰当的统计分析方法来对手机来的数据进行分析,提取数据中的有用信息形成结论并对数据再进行深入研究总结过程。目的是为了利用数据来理性思考和决策的过程。数据分析过程包

    2023-09-03