KEJIJISNASUO ,QIKAN ,HUANYINGNIDE XIAZAI ! LIANXIFANGSHI:BINDIYI@163.COM

源代码在线查看: 中文—[7]浅谈数据仓库技术和在图书馆中的应用.txt

软件大小: 5537 K
上传用户: shicg666666
关键词: LIANXIFANGSHI KEJIJISNASUO HUANYINGNIDE BINDIYI
下载地址: 免注册下载 普通下载 VIP

相关代码

				四川图书馆学报2002 年5 期总第129 期
				
				文章编号:1003 -7136 (2002)05 -0025 -04 
				
				浅谈数据仓库技术和在图书馆中的应
				用
				
				
				臧其
				梅
				(江南大学图书馆,江苏无锡 214036)
				
				
				
				摘 要:论述了数据仓库产生的背景和几个基本概念,数据仓库在国内外成功应用实
				例及在图书馆中的应用。
				关键词:数据仓库;决策支持系统;面向主题;图书馆;应用
				中图分类法: G250174    文献标识码:A 
				完善,并得到广泛的应用。但是目前国际上
				
				对DW 没有一个统一、严格的定义,比较常见
				
				的定义有: 
				
				“DW 是来自一个或多个数据库数据的
				
				拷贝”。
				
				“DW 是作为DSS 服务基础的分析数据
				
				库,用来存放大容量的只读数据,为制定决策
				
				提供所需信息”。
				
				斯坦福大学数据仓库研究小组则认为
				“数据仓库是集成的存储中心,这些信息可用
				于查询或分析”。
				
				我国学者基本上认同W. H. Lnmon 的
				
				定义,并对数据仓库作了更详尽的表述:数据
				
				仓库是一种解决问题的方案,而不是可以买
				
				到的现成产品,是一种技术手段
				—
				它把某
				
				单位各个不同的数据从传统的数据库中进行
				
				清理、抽样和转换,并按决策主题的需要进行
				
				重新组织,然后放到一个集中的数据库中,供
				
				决策人员分析、利用。
				
				212  数据仓库的特点
				
				数据仓库技术是从传统的数据库技术发
				
				展而来的,它们都具有独立性和共享性。但
				
				
				1  前言
				
				当信息化浪潮席卷全球后,各行各业都
				在花大力气建立自己的数据库。多年来数据
				库技术在提高企业生产和经济效益、改善部
				门的管理,减轻工作人员的劳动强度等方面
				做出了巨大贡献。但是随着网上信息资源的
				急剧增加,用户的迅速激增,人们越来越不满
				足于数据库技术以单一数据库进行简单的事
				务处理,不能满足管理人员制定决策所需要
				的多层次、多方面、及时、快捷、便利的信息需
				求。于是这一供需矛盾,吸引了众多专家去
				研究,数据仓库技术便应运而生。
				
				2  数据仓库技术的定义和特点
				
				211  数据仓库的定义
				
				数据仓库(Data Warehouse) 简称DW。最
				早是由被誉为“数据仓库之父”Prism Soultion 
				公司的副总裁W. H. Lnmon 对其下的定义: 
				
				“DW 是支持管理决策过程的,面向主题的、
				
				集成的、稳定的、不同时间的数据集合”。数
				
				据仓库技术从20 世纪80 年代中期提出,到
				
				现在仅仅十多年时间,就从悄然兴起到日臻
				
				收稿日期:2002-05-20 
				
				
				. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 
				
				
				四川图书馆学报2002 年5 期总第129 期
				
				DW 具有自己的特点。
				
				DW 面向主题,每一个主题基本上对应
				一个宏观的分析领域,并且能反映它们之间
				联系的数据组织方式,它主要支持在线分析
				处理(OLAP) 。
				
				DW 的数据来源于原有的操作型事务处
				理的数据库,在经过数据抽取、加工、集成、按
				决策主题整合后放入一个数据仓库中去,形
				成结构化、易于导航的数据,能对决策分析进
				行快速、正确的响应。
				
				DW 数据规模大, 一般超过50GB 或更
				
				DW 的数据具有稳定性,存储有关各个
				主题的不同时期的综合信息和详细的历史数
				据根者策
				人员提供经销代理商的作业绩。该公司所工
				分析工具,为此建立了两个DW ,一个用于为
				管理人员提供成本信息;另一个用于为管理
				据,一般保留5~10 年,供决长期趋建DW 很成功,获得了高收益,投资收益率为
				
				势进行分析,用户使用时不进行数据更新操
				作。
				
				DW 面向决策支持,其体系结构保证了
				查询和分析的实时性,DW 一般设计成只读
				方式,最终用户不能直接更新,通常由系统自
				动化和管理员控制,协同完成。DW 中存储
				的是综合性数据,是不同时间数据的集合,经
				常按时间综合或隔一定时间抽样及随时间变
				化而更换、综合。
				
				数据仓库技术的出现最主要的贡献是: 
				明确地提出把数据处理分为操作型处理和分
				析型处理两大类,使得不同的数据处理在不
				同的数据环境中进行。
				
				综上所述,数据仓库是在现存的数据库
				系统的基础上进行开发的,着眼于有效的抽
				取、综合、集中和挖掘已有数据库的数据资
				源,服务于机构或组织高层领导决策管理分
				析的需求,其开发过程是一个经过不断循环、
				反馈、增长和完善的过程,因此DW 在整个开
				发过程中,自始至终要求决策人员和开发者
				共同参加和密切合作,不做或尽量少做无效
				工作或重复劳动。据加拿大IDC 公司1996 
				年专门开展的一项关于DW 投资与收益的调
				查研究,其结果表明:被调查的62 个欧美企
				业或部门,平均每个DW 项目投资在2200 万
				美元,平均投资收益率为401 %,最大的超过
				1000 %,投资回收213 年。因此DW 的创建
				
				26 
				
				大。
				
				是长期、复杂且面临很大的风险,必须谨慎郑
				重,但是获得成功又会带来巨大的效益和具
				有强大的竞争力。
				
				3  数据仓库在国内外成功的实例
				
				美国麻萨诸塞州政府,采用DW 来管理
				信息,成功地帮助州政府进行了机构重组,使
				州政府在预算方案及报表处理两个方面,得
				到完整、高效、及时的完成。
				
				荷兰Interpolis 公司是一个跨国的保险公
				司,迫切需要准确、及时的数据和全新的信息
				
				568 %。
				
				美国Niagara Mohawk 能源公司为了准确
				地计算出能源供应与运输成本,提高工作效
				率和管理水平,从而科学地制定出明智的长
				期投资决策,创建了DW ,获得了极大成功, 
				投资收益率高达1413 %。
				
				中国银行广东分行承担和开发国家“八
				五”科技攻关项目
				—
				—“中国银行省、市两级
				金融管理信息系统示范系统”在国内率先引
				进、应用数据仓库、联机分析处理、多维数据
				库等先进理论,并实现了业务信息和管理信
				息的统一及数据采集存储自动化。该项目
				1992 年由中国银行总行下达,1996 年通过国
				家鉴定和验收。该项目使中国银行实现信息
				一体化战略并且成为全球金融信息服务系统
				的重要组成部分。
				
				上海强生公司利用IBM 公司的可视化
				数据仓库解决方案和面向对象的关系数据
				库,成功地建立了数据仓库,有效地研究消费
				者的消费动态,提高了信息利用和分析能力, 
				提高了企业竞争优势。
				
				大连理工大学为大连市地税局成功地运
				用数据仓库技术,开发了“大连地税个人所得
				税代扣代缴软件”,提高了工作效率。
				
				4  数据仓库在图书馆中的应用
				
				411  为上级决策提出快速有效的信息服务
				
				
				. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 
				
				
				浅谈数据仓库技术和在图书馆中的应用
				
				图书馆担负着为上级主管部门决策提供
				信息服务的职能。各国国家图书馆为本国政
				府提供全方位的信息服务;公共图书馆为当
				地政府提供全方位的信息服务;大学图书馆
				为学校领导提供全方位的信息服务。在计算
				机未引入图书馆之前,馆员们只能依靠手工
				检索、查询为管理层决策提供信息服务,在计
				算机引进图书馆后,数据库作为信息数据的
				管理手段,馆员依靠数据库技术为上级决策
				提供有效的信息服务,尤其是数据库技术使
				事务处理的应用获得了巨大成功。但是随着
				
				图书馆的文献信息资源采集是十分重要
				的一项工作,全国文献信息资源的整体化建
				设是图书馆界多年来追求的目标,但实施起
				来却收效不大。因为文献采集是每个图书馆
				自己的事情,渠道主要是出版社、杂志社、书
				店或书商,所以导致一方面重复购置,浪费人
				财物力,另一方面又大量缺漏,难以实施全国
				文献资源整体化建设的目标。因此每个图书
				馆都存在相当大比例的文献长期无人问津, 
				而读者急需的文献却连一本也找不到的现
				象。
				
				信息资源的剧增,以联机和分析处理为主的
				要主
				有、速
				如果图书馆以全国文献信息资源界现在
				决策支持系统(DSS) 的应用,使数据库技术整体化建设为管理控制目标,创建一个面向
				越来越无法满足上级对决策信息的快文献采集核心业务工作这一主题的数据仓库
				效的需求
				层提供面向主题、
				型析分于
				时这, 数据仓库技术应运而生, 的话,我国图书馆界所追求的目标—
				— 
				全国
				是适用数据的处理,是为管理决策文献信息资源整体化建设,将能有效的实现。
				
				面向分析、面向决策人员, 我们可以多渠道采集,多方位订购,它们包括
				支持管理需要的,是为管理决策层提供面向专家推荐,光盘查询、网上检索、用户内阅外
				主题决策分析的,因为DW 发展十分迅速。借的统计,并通过联机分析处理(OLAP) 和决
				
				图书馆要为上级主管部门提供决策信息策分析支持系统(DSS) 及数据挖掘技术(DM) 
				服务。就目前而言,我国各行各业都建有自等数据仓库技术为全国文献信息资源建设提
				己的数据库,大多为本单位使用,图书馆系统供科学、合理的布局和订购数量的各种分析
				也不例外,因此图书馆界可以联合起来,创建报告、统计报表、预测信息,图书馆可以通过
				一些面向主题的、以对政府各部门以决策管网络获得信息,及时交流、沟通、协调。因此
				理控制为目标的数据仓库项目,由各个图书笔者认为我国图书馆界,应该引进DW 技术, 
				馆申请承担子项目,这样联合建库,真正走共建立一个以全国图书馆文献信息资源整体化
				知共建共享的道路,同时这也是真正能打破建设为管理控制目标的DW ,并且在我们文
				我国图书馆界几十年条块分割所形成的壁垒献建设的全过程中,自始至终请读者参与,使
				的有效途径。对于DW 的设计思想,笔者认采购决策能时时刻刻地了解读者的需求和尽
				为要建立一个系统化的数据存储环境,各个可能满足读者需求。图书馆可以通过网上书
				参建数据仓库的图书馆分别按所承担的项店和电子商务来开展文献资源采集,这样不
				目,将分析决策所需要的大量数据从本单位仅能极大缩短文献从采购到被读者利用的时
				已有的传统操作环境中分离出来,使分散的、间周期,而且使文献资源整体化建设能有效
				难以访问的操作数据经过加工,集成转换成实现。
				集中统一随时可用的信息。引入数据仓库理413  DW 能对文献信息资源有效利用提供
				论必将使我国图书馆事业的整体化建设得到决策支持作用
				决定性的突破,将使我们的工作能从事务性人类社会已进入信息时代,信息服务也
				处理转变为面向主题、决策分析处理,为各级面临着前所未有的巨大市场,用户信息的个
				政府和上级领导部门进行决策提供有效、及性化需求更为强烈,图书馆作为信息服务的
				时、全面的信息服务。主力军也更加注重研究如何有效地开展对用
				412  DW 对图书馆文献信息资源的采集能户的服务。目前用户不仅要求满足对文献书
				起到决策支持作用目、参考文献信息及信息线索的索取,而且更
				
				27 
				
				
				. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 
				
				
				四川图书馆学报2002 年5 期总第129 期
				
				果,DW 中的数据来源于已有的数据库,其设[M]. 北京:科学出版社,1998. 
				计可以根据实际需要决定存放那些数据和怎[2] 张学福. 数据仓库技术与我国市场决策支
				样方便用户使用。持信息资源建设[J ]. 中国图书馆学报, 
				
				DW 是20 世纪80 年代中期新兴的技术
				撑。
				参考文献:
				, 
				目前已在国内外金融、电信、保险、政府及企
				业广泛应用且发挥着重要作用。究其迅速发
				策这两个方面的需求日趋增加驱动下的结
				主要是用户在全局应用和分析决展的原因, 
				[1] 王 珊等. 数据仓库技术与联机分析处理
				
				需求的是有深度内容信息文献的全文或专题帮助我们将数据面向主题集成和综合,不仅
				文献的全文获取、专题的信息咨询服务。因提供了容纳大量信息的场所,而且对信息资
				此图书馆建立数据仓库以满足用户所需信息源的适时分析和深层挖掘提供了技术支撑, 
				咨询和科技查新的决策支持服务体系就变得使已有的大规模分布数据库间快速存取和可
				十分迫切了。这将能充分发挥图书馆界的群互操作性得以实现,以及使基于并行处理的
				体优势、信息资源优势,借助网络技术、计算高速查询引擎得以实现,随着数据仓库在数
				机技术、数据仓库技术,馆员们将能开展集信字图书馆研究中的应用,必将提高图书馆对
				息检索提供服务于一体的面向内容和直接满用户的信息服务能力;必将使馆员在将已有
				足用户需求,面向主题信息资源的服务。数据按面向主题进行抽取、集合、组织、综合
				414  DW 能对数字图书馆的发展提供技术这一专业领域中
				使数字图书馆建设与发展得到关键的技术支
				,大显身手;必将提高图书馆
				支撑决策能力和信息资源的整体应用效应;必将
				
				21 世纪是数字图书馆的时代,虽然DW 1999 , (2) :37~42. 
				技术在数字图书馆研究中刚刚开始, 但是[3] 徐 仲. 数据仓库技术在图书馆中的应用
				[J ]. 图书馆建设,2001 , (1) :51~52. DW 技术在知识发现、数据挖掘、数据集成和
				[4] 杨 立,马文秀. 网络时代高校图书馆信
				综合、组织和分析、面向主题的支持分析决策
				息服务研究[J ]. 现代图书情报技术,
				
				等方面有着巨大的潜力和功能,数字图书馆
				2001 , (2) :84~85 ,87. 
				的馆藏是海量般的信息资源, DW 技术可以
				
				Discussing on the Technology of Data Warehouse 
				and the Application in Library 
				
				ZANGQi2mei 
				
				( Library , Jiangnan University , Wuxi 214036 , China) 
				
				Abstract : Dwelling on the background generated of data warehouse 、some basic conceptions and some 
				successful applied examples in this field at home and abroad , also discussing on application in library at 
				last. 
				
				Key word : data warehouse ; decision2making supported system ; facing theme ; application ;library 
				
				作者简介: 
				臧其梅,女,1978 年从事图书馆工作,研究馆员,参编出版7 本专著,公开发表本专业论文40 篇。
				
				28 
				
				
				. 1994-2006 China Academic Journal Electronic Publishing House. All rights reserved. http://www.cnki.net 
				
				
							

相关资源