当前位置: 代码网 > it编程>软件设计>交互 > 一篇文章搞懂数据仓库:数据仓库的8个发展阶段

一篇文章搞懂数据仓库:数据仓库的8个发展阶段

2024年08月06日 交互 我要评论
全企业集成(EnterpriseIntergration,1988)同时,IBM也在处理信息管理不同方面的问题,其最烦人的问题是不断增加的信息孤岛,IBM的很多客户要面对很多分立系统的数据集成问题,而这些系统有不同的编码方式和数据格式。第一次,MIT的研究员将业务系统和分析系统分开,将业务处理和分析处理分成不同的层次,并采用单独的数据存储和完全不同的设计准则。用户服务用以支持对数据的直接交互,包含了其他服务的所有人机交互界面,这是系统架构的一个非常大的转变,第一次将交互界面作为单独的组件提出来。

四 确立阶段(1991)

五 数据集市(1994-1996)

六 争吵与混乱(1996-1997)

七 合并(1998-2001)

八 未来


一 概念阶段(1978-1988)

=================

数据仓库最早的概念可以追溯到20世纪70年代mit的一项研究,该研究致力于开发一种优化的技术架构并提出这些架构的指导性意见。第一次,mit的研究员将业务系统和分析系统分开,将业务处理和分析处理分成不同的层次,并采用单独的数据存储和完全不同的设计准则。同时,mit的研究成果与80年代提出的信息中心(informationcenter)相吻合:即把那些新出现的、不可以预测的、但是大量存在的分析型的负载从业务处理系统中剥离出来。但是限于当时的信息处理和数据存储能力,该研究只是确立了一个论点:这两种信息处理的方式差别如此之大,以至于它们只能采用完全不同的架构和设计方法。

二 萌芽阶段

======

在80年代中后期,作为当时技术最先进的公司,dec已经开始采用分布式网络架构来支持其业务应用,并且dec公司首先将业务系统移植到其自身的rdbms产品:rdb。并且,dec公司从工程部、销售部、财务部以及信息技术部抽调了不同的人员组建了新的小组,不仅研究新的分析系统架构,并要求将其应用到其全球的财务系统中。该小组结合mit的研究结论,建立了ta2(technicalarchitecture2)规范,该规范定义了分析系统的四个组成部分:

  • 数据获取

  • 数据访问

  • 目录

  • 用户服务

其中的数据获取和数据访问目前大家都很清楚,而目录服务是用于帮助用户在网络中找到他们想要的信息,类似于业务元数据管理;用户服务用以支持对数据的直接交互,包含了其他服务的所有人机交互界面,这是系统架构的一个非常大的转变,第一次将交互界面作为单独的组件提出来。

三 集成阶段

======

全企业集成(enterpriseintergration,1988)同时,ibm也在处理信息管理不同方面的问题,其最烦人的问题是不断增加的信息孤岛,ibm的很多客户要面对很多分立系统的数据集成问题,而这些系统有不同的编码方式和数据格式。1988年,为解决全企业集成问题,ibm爱尔兰公司的barrydevlin和paulmurphy第一次提出了“信息仓库(informationwarehouse)”的概念,将其定义为:“一个结构化的环境,能支持最终用户管理其全部的业务,并支持信息技术部门保证数据质量”,并在1991年在decta2的基础上把信息仓库的概念包含进去,并称之为vital规范(virtuallyintegratedtechnicalarchitecturelifecycle),将pc、图形化界面、面向对象的组件以及局域网都包含在vital里,并定义了85种信息仓库的组件,包括数据抽取、转换、有效性验证、加载、cube开发和图形化查询工具等。但是ibm只是将这种领先的概念用于市场宣传,而没有付诸实际的架构设计。这是ibm有一个领域上创新后停止不前导致丧失其领先地位。因此,在90年代初期,数据仓库的基本原理、框架架构,以及分析系统的主要原则都已经确定,主要的技术,包括关系型数据存取、网络、c/s架构和图形化界面均已具备,只欠东风了。同时,在1988年-1991年,一些前沿的公司已经开始建立数据仓库。

四 确立阶段(1991)

============

企业级数据仓库(edw,1991)1991年,billinmon出版了其有关数据仓库的第一本书,这本书不仅仅说明为什么要建数据仓库、数据仓库能给你带来什么,更重要的是,inmon第一次提供了如何建设数据仓库的指导性意见,该书定义了数据仓库非常具体的原则,包括:数据仓库是面向主题的(subject-oriented)、集成的(integrated)、包含历史的(time-variant)、相对稳定的(nonvolatile)、面向决策支持的(decisionsupport)面向全企业的(enterprisescope)最明细的数据存(atomicdetail)数据快照式的数据获取(snapshotcapture)这些原则到现在仍然是指导数据仓库建设的最基本原则,虽然中间的一些原则引发一些争论,并导致一些分歧和数据仓库变体的产生。

但是,billinmon凭借其这本书奠定了其在数据仓库建设的位置,被称之为“数据仓库之父”。

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

一个人可以走的很快,但一群人才能走的更远!不论你是正从事it行业的老鸟或是对it行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

快,但一群人才能走的更远!不论你是正从事it行业的老鸟或是对it行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

(0)

相关文章:

版权声明:本文内容由互联网用户贡献,该文观点仅代表作者本人。本站仅提供信息存储服务,不拥有所有权,不承担相关法律责任。 如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 2386932994@qq.com 举报,一经查实将立刻删除。

发表评论

验证码:
Copyright © 2017-2025  代码网 保留所有权利. 粤ICP备2024248653号
站长QQ:2386932994 | 联系邮箱:2386932994@qq.com