联机分析处理概述
发展背景
随着数据库技术的广泛应用,企业信息系统产生了大量的数据,如何从这些海量数据中提取对企业决策分析有用的信息成为企业决策管理人员所面临的重要难题。传统的企业数据库系统(管理信息系统)即联机事务处理系统(on-line transaction processing,简称oltp)作为数据管理手段,主要用于事务处理,但它对分析处理的支持一直不能令人满意。因此,人们逐渐尝试对oltp数据库中的数据进行再加工,形成一个综合的、面向分析的、更好的支持决策制定的决策支持系统(decision support system,简称dss)。企业目前的信息系统的数据一般由dbms管理,但决策数据库和运行操作数据库在数据来源、数据内容、数据模式、服务对象、访问方式、事务管理乃至无力存储等方面都有不同的特点和要求,因此直接在运行操作的数据库上建立dss是不合适的。数据仓库(datawarehouse)技术就是在这样的背景下发展起来的。数据仓库的概念提出于20世纪80年代中期,20世纪90年代,数据仓库已从早起的探索阶段走向实用阶段。业界公认的数据仓库概念创始人w.h.inmon在《building the datawarehouse》一书中对数据仓库的定义是:“数据仓库是支持管理决策过程的、面向主题的、集成的、随时间变化的持久的数据集合”。构建数据仓库的过程就是根据预先设计好的逻辑模式从分布在企业内部各处的oltp数据库中提取数据并对经过必要的变换最终形成全企业统一模式数据的过程。当前数据仓库的核心仍是rdbms管理下的一个数据库系统。数据仓库中数据量巨大,为了提高性能,rdbms一般也采取一些提高效率的措施:采用并行处理结构、新的数据组织、查询策略、索引技术等等。