Further Reading

Further Reading1
教学音频+参考译文
数据仓库和数据挖掘

数据仓库是一种数据库,它将从各种生产和运营系统中提取数据合并到一个大型数据库中,可用于管理状况的报告和分析。来源于机构核心事务处理系统的数据被重新组织并与其他信息合并,包括历史数据,这样,这些数据可用于管理决策和分析。

对于一个不断进取的、具有竞争力的、专注的组织来说,数据库不是一个附属品,而是必需品。它是建立决策支持和执行信息系统工具的合适的基础,这些工具通常用于衡量和评价组织目标的实现程度。

在大多数情况下,数据仓库中的数据只可用来进行报告,不可进行更新,所以公司的基础运营系统的性能将不会受到影响。数据仓库这种侧重解决问题的特性,使众多的公司由于使用了数据仓库而获益。

数据仓库通常有重构数据的能力。关系数据库的数据视图可使用户从两个维度观察数据。多维数据视图允许用户以多于两个维度的方式观察数据。

数据挖掘是关于使用自动或半自动化方法分析数据和寻找隐含模式的技术。数据挖掘对企业有重要的商业价值,比如增加竞争力、顾客细分、(客户)流失分析、交叉销售、销售预报、欺诈检测、风险管理等等。

在过去的十年中,大管的数据积累并存住在数据库中。大部分数据来自商业软件,如财务应用软件、企业资源计划(ERP)系统、客户关系管理(CRM)软件和网络日志。这些数据的收集,使得各个组织的数据丰富而知识匮之了。数据收集已经受到限制了。数据控掘的主要目的是从现有数据中提取模式,增加数据的自身价值,并将这些数据转变为知识。

数据挖掘为数据集提供算法,如决策树、聚类算法、关联算法、时序等算法等,并分析它们的内容。这种分析产生了模式,可以探索有价值的信息。取决于基本算法,这些模式可以呈现为树形、规则、聚类或仅仅是一组数学公式。这些模式中发现的信息可用于报告,指导市场营销策略的制定,而最重要的是用于预测。