数据挖掘与数据仓库之间的区别

作者: Laura McKinney
创建日期: 2 四月 2021
更新日期: 4 可能 2024
Anonim
05、数据仓库  基本概念&和数据库区别
视频: 05、数据仓库 基本概念&和数据库区别

内容


数据挖掘和数据仓库都用于保持商业智能并支持决策。但是,数据挖掘和数据仓库在处理企业数据方面都有不同的方面。一方面, 数据仓库 是一种环境,企业数据以汇总和汇总的方式收集和存储。另一方面, 数据挖掘 是一个过程;应用算法从数据库中甚至不存在的数据中提取知识。

让我们借助下面显示的比较表来检查数据挖掘和数据仓库之间的区别。

  1. 比较表
  2. 定义
  3. 关键差异
  4. 结论

比较表

比较依据数据挖掘数据仓库
基本的 数据挖掘是从数据库/数据仓库检索或提取有意义的数据的过程。数据仓库是一个存储库,来自多个源的信息存储在一个模式下。

数据挖掘的定义

数据挖掘是 发现知识,你 没想到存在于您的数据库中。使用传统的查询工具,您只能从数据中检索已知信息。但是,数据挖掘为您提供了一种 从数据中检索隐藏的信息。数据挖掘从数据库中提取可用于以下目的的有意义的信息 做决定.

数据库中的知识发现,称为 凯迪展品 关系图案。该关系可以在两个或更多不同对象之间,同一对象的属性之间。模式是数据挖掘的另一个结果,它显示了有助于决策的规则且可理解的信息序列。

首先可以概括KDD中涉及的步骤,即数据库中的知识发现, 选择 必须执行数据挖掘的数据集。接下来是 预处理 其中涉及删除不一致的数据。然后来 数据转换 将数据转换为适合数据挖掘的形式。接下来是 数据挖掘,此处数据挖掘算法将应用于数据。最后, 解释与评价 其中涉及提取数据之间的关系或模式。


数据挖掘非常适合以汇总和汇总方式存储数据的数据仓库环境。随着在数据仓库中挖掘数据变得容易

数据仓库的定义

数据仓库 是信息的中心位置 从多个来源收集的数据存储在单个统一模式下。首先收集数据,然后清理和转换不同的企业资源,并将其存储在数据仓库中。一旦将数据输入到数据仓库中,它就会在其中停留很长时间,并且可以超时访问。

数据仓库是诸如以下技术的完美结合 数据建模,数据采集,数据管理,元数据管理,开发工具商店管理。所有这些技术都支持以下功能 数据提取,数据转换,数据存储,提供用于访问数据的用户界面.

数据仓库不是产品或软件,它是一个信息环境,它提供诸如企业的集成视图之类的信息。您可以访问企业的当前和历史数据,这有助于做出决策。它支持决策交易,而不会影响操作系统。它是获取战略信息的灵活资源。

  1. 数据挖掘和数据仓库之间存在一个基本区别,即数据挖掘是从大型数据库或数据仓库中提取有意义的数据的过程。但是,数据仓库提供了一种以集成形式存储数据的环境,这简化了数据挖掘以更有效地提取数据的过程。

结论:

只有在集成良好的大型数据库(即数据仓库)中才能进行数据挖掘。因此,数据挖掘之前必须完成数据仓库。数据仓库必须具有完整集成的信息,以便数据挖掘可以有效地提取知识。