《MS SQL Server 2000管理员手册》系列——29. 使用 Microsoft SQL Server 分析服务[1]

[入库:2006年2月23日] [更新:2007年3月24日]

本文简介:

29. 使用 Microsoft SQL Server 分析服务
Analysis Services概观
安装Analysis Services
使用Analysis Services
本章总结
Microsoft SQL Server 2000 Analysis Services(过去被称为 OLAP Services),是 SQL Server 2000 中设计来协助您从事 在线分析处理(online analytical processing,OLAP) 的一个组件,利用这个组件可让您在您的数据仓储与数据超市中存取与采撷资料。在本章中,您可学习到何谓 Analysis Services 组件,如何安装以及如何使用这些组件;此外,您也会学习到 SQL Server 2000 中 Analysis Service 新增的功能。由于本书主要是写给 SQL Server 管理员而非应用程序开发人员,因此我们的讨论将仅止于安装、设定与管理 Analysis Services 等主题,应用程序开发的部分则不在讨论范围之内。
________________________________________
说明
在本章中,我们可能会不断的提到 数据仓储(data warehouse) 与 资料超市(data mart) 这两个专有名词。数据仓储可以从几个不同的方向来定义,其中之一是把它视为一个商业数据的仓库,其储存了从公司 在线交易处理(online transaction processing,OLTP) 系统所获得的历史数据以及当前数据。数据超市类似于数据仓储,不过其所包含的资料仅与公司的某一方面有关。举例来说,公司可能拥有一个数据仓储,内含应付帐款、应收帐款以及人力资源等数据,以及一个数据超市,内含应付帐款资料。组成数据仓储与数据超市的数据通常被规划成星状结构描述或雪花状结构描述,这些在本章稍后都会有所说明。本章所讨论的概念大部份均能用在数据仓储与数据超市,因此除非特别说明,我们使用数据仓储来同时代表这两种数据库。
________________________________________
Analysis Services 概观
 
Analysis Services 是一套工具,可用来协助您开发与管理用于在线分析处理的数据。Analysis Services 由 Analysis Service 服务器、English Query 以及其它支持组件所组成。Analysis Service 服务器建构数据的 cube 协助您进行多维度分析,Cube一词是用来描述一个汇总或摘要的数据集合,藉以处理复杂的分析查询,如每月销售结果与销售计划。(Cube 会在本章稍后 〈OLAP Cubes〉 一节中详细说明。)
在多维度分析中,多个查询会从不同的观点或维度来搜寻数据库。举例来说,假设现有一个自行车商数据库,其中仍保持着去年的销售数据。在多维度分析作业中的一个查询可能正在搜寻客户购买习惯,另一个查询搜寻的却是每月销售量,同时更有一个查询找的是某一特定款式的自行车或组件的销售成绩。虽然数据是分享给所有的查询,但每个查询却以不同的观点(维度)来看待资料。
Analysis Service 组件
 
Analysis Services 提供了一些工具与精灵,让您可用来存取多维度资料。Analysis Service 由下列组件组成:
•   分析管理员 :提供一个 GUI 来使用 Analysis Service,如建立 Cube、管理安全性以及浏览数据来源。
 
•   资料仓储架构 :一组实作 SQL Server 2000 数据仓储功能的组件与 API。
 
•   数据转换服务(DTS) :协助加载及转换数据到数据超市或数据仓储。DTS 是由汇入精灵与汇出精灵组成,可用来迁移数据及转换数据。DTS 的细节介绍请参阅 第24章 。
 
•   储存机制(Repository) :包含一些接口、数据库结构描述模型,以及预先定义的数据转换方式以符合数据仓储架构。因为数据转换是建立在有规则的基础上,所以它们的定义可以储存起来,以供将来重新使用。
 
•   资料采撷(Data Mining) :提供了定义与实作多维度 cube 的算法。
 
•   English Query :英文语系的问题转换为可以在数据库上执行的 SQL 陈述式。
 
•   延伸标记语言(XML) :提供一个标准格式化与数据呈现的语言。XML 是应用程序对应用程序之间数据转换的重要组件,并可用来将数据出版至因特网。
 
在本章中,我们会将这些组件组合在一起,犹如组合拼图的各个部分,藉以提供一个统合的工具。
OLAP Cube
 
在 Analysis Services 中资料的主要表现形式是 OLAP cube。 Cube 是详细数据以及摘要数据的多维度表现形式, 详细数据 是特定数据列的数据,而 摘要数据 是汇总数据。Cube 是基于数据自身的分析需求而设计的。每一个 cube 代表一个不同的商务实体,如销售额、存货等等。Cube 的每一个面表示资料中不同维度的情状。换言之,cube 是由数据许多不同的面向所组成,所以称为一个「数据 cube」。
Analysis Services cube 可透过两种数据库结构描述来建立:星状结构描述和雪花结构描述。 结构描述(Schemas) 事实上是一个发展中的论题,但为了适当的描述 Analysis Services,我们在这里简单的了解一下结构描述。这两种结构描述都是由事实数据表和维度数据表构成。Analysis Services 在数据表中汇总这些数据以建立 cube。让我们更详细一点来看这个过程。
事实资料表
 
 事实数据表(fact table) 是数据仓储中储存历史数据的数据表,这些历史数据是数据仓储的核心信息。在我们的自行车商范例中,这个信息是一个发生在自行车商行的交易记录(包括数据库交易与销售交易)。这个记录内的数据涵盖了交易日期、交易类型、销售项目、交易的总金额、顾客姓名、销售员姓名等等。这个记录可用来作为多维度分析的基础。
正如您所看到的,事实数据表的数据是以商业交易为中心的数据。这些交易可以是某物品的销售、信用卡交易和利润等等。基本上,事实数据表记录着一些商业事件的类型。
数据仓储中的事实数据表是数据库中最大的数据表,并且也是操作最频繁的数据表。您可能想象得到,事实资料表可以包括数百万个记录,且能够占据超过 1TB(或 1024 GB)的空间。
维度资料表
 
 维度数据表(dimension table) 用来定义事实数据表中的字段,例如售货员姓名、交易类型或是项目等等。这个过程与 正规化(normalization) 过程相类似,两者都是拣取有用的数据以加快处理的效率。事实数据表包含交易的历史信息,而维度数据表所包含的信息,则指出如何从事实资料表中取得有用的材料。换言之,维度资料表是用来载明事实资料表中所包含的资料的意义。
举例来说,对于一个包含着销售记录的事实数据表而言,可能有一个维度数据表包含着与销售代表有关的信息,可用来建立像是每个业务员的月份销售额这类摘要资料;而另一个维度数据表则是包含着地区信息,可用来建立每地区月份销售额这类摘要数据。
维度数据表并不像事实资料表那般庞大,相反的是维度数据表通常很小且往往仅含有几个数据列。数据仓储一般说来只会有一个到两个事实资料表,但却有好几个维度资料表。
结构描述
 
 星状结构描述(star schema) 是相当常见的一种资料仓储架构,它由一个事实数据表和一些维度数据表组成。星状结构描述意味着一个事实数据表被维度数据表所环绕,呈一颗星的形状。每一个维度数据表相当于事实数据表中的一个资料行。这些维度数据表是用来架构分析的基础,以便我们对事实数据表中的数据进行分析。
 雪花结构描述(snowflake schema) 中,几个维度资料表在联结到事实数据表之前相互联结,换句话说,先建立一些维度数据表的阶层,每一层相当于事实资料表中的一个资料行。图 29-1 显示了星状结构描述与雪花结构描述。

本文关键:《MS SQL Server 2000管理员手册》系列——29. 使用 Microsoft SQL Server 分析服务
  相关方案
Google
 

本站最佳浏览方式为 分辨率 1024x768 IE 6.0(或更高版本的 IE浏览器)

go top