基于CWM的 数据仓库体系结构设计 我的论文题目是。。。 论文的内容主要是总结了我以下两个部分的工作.

Slides:



Advertisements
Similar presentations
1 中 间 件 技 术中 间 件 技 术. 2 第 1 章 中间件产生背景及分布式计算环境 主要内容 开放系统 互操作性 中间件.
Advertisements

顧客關係管理:整合雲端應用服務.陳美純著.前程文化 出版 第十三章 商業智慧在顧客關係管理 的應用 授課教師:
教育技术装备统计系统 使用培训 教育部基础教育司 教育部教育管理信息中心.
新生儿硬肿症 福建医科大学附属协和医院儿科 陈 珊.
新生儿寒冷损伤综合征.
教育社会学 主讲人 李慧玲.
以XML可延伸式標注語言建立文章標誌系統研究- 以蘇軾詩為範圍
任务二 面向对象的建模 4. UML静态建模 类图 对象图 包图 组件图.
开发者:徐 庆 版权所有:黄河勘测规划设计有限公司
母 婴 护 理 师 制作:小九.
四川环境信息资源中心建设总体思路探讨 ——以云计算技术构建环境数据中心 四川省环境信息中心 陈力.
顧客交易紀錄分析實務 概述 26.2 資料分析的過程 26.3 顧客交易紀錄分析說明 26.4 實作一、顧客活動剖析實務演練
系统集成项目管理工程师培训 中视广信 卢志强 2011年4月.
五子棋.
学生教育办介绍 2015年9月.
第 八 章 体育与文化 冯金忠.
赴日本理光工作实习生 和软件工程师项目简介.
全国“三新”作文研讨会成果交流 罗外初中部 曾祎闱.
MUYAOLIN Finance Class
第六章 資料倉儲與採礦技術 6.1 資料倉儲與採礦定義 6.2 資料採礦之步驟與技術分類 6.3 資料採礦在顧客關係管理之應用
從創造力教學 談科學實驗設計 屏東縣立車城國民中學 李明正 (三)
职业生涯规划书 金融系 1058班 XXX.
第二章 项目一:企业厂区与车间平面设计 1.
(贵阳市城市应急预警联动指挥平台解决方案)
中国矿业大学银川学院 2014暑期实习答辩 姓名:张 班级:工程 指导老师:6 学号:
<<Oracle DBA工厂-Oracle从入门到精通>>全套视频教程(一)之 安装部署 讲师:黄利强 QQ:
京东金融 介绍.
公文/檔案管理作業流程 簡 報 總務處 文書組 報告人:田至琴 9 7 年3 月7 日 1 1.
市场项目介绍 毛可昕 各位领导:上午好,我是经营发展部毛可昕,今天就一些新的市场项目给各位领导做汇报。
财务报表无纸化网上报送培训.
软件体系结构 (Software Architecture)
第10章 考试系统的分析与设计 1.
第七章 电子政府的支撑技术 制作人:王 静.
普通高等教育“十一五”国家级规划教材 信息系统分析与设计 刘腾红 孙细明 主编 科 学 出 版 社.
第 4 章 CRM資料倉儲.
第十六章 賽局理論 Game Theory 作業研究 二版 2009 © 廖慶榮.
作業系統 第二十章 分散式系統實例.
線上分析處理、 資料採礦與 Analysis Services
第五章 信息与系统集成技术 概述 数据流集成技术 信息流集成技术 信息管理集成技术 流程重组与业务流程集成 企业门户集成 企业集成架构
分布式对象标准介绍 企业要构建多层分布式系统,必须遵循分布式标准,基于什么样的标准将直接影响到企业应用系统的开放性和可扩展性。目前业界分布式对象技术主要有三种架构标准: Microsoft的COM/DCOM/COM+ OMG组织的 CORBA。 Sun Microsystems的Enterprise.
彰化縣政府補助辦理網頁設計資料庫應用班 資料庫簡介 建國技術學院資管系 饒瑞佶.
第一篇 数据仓库与OLAP 第一章 数据仓库基本概念
從ERP到企業E化.
課程名稱:資料庫系統 授課老師:李春雄 博士
課程名稱:資料庫系統 授課老師:李春雄 博士
第5章 資料倉儲的資料建置.
第二章 資料倉儲開發模型 2. 1 資料倉儲開發模型概述 2. 2 資料倉儲概念模型 2. 3 資料倉儲的邏輯模型 2
软件服务生态中的非确定性科学问题、互操作性的应用基础问题
花蓮縣光復鄉大進國民小學 106年度教師防災計畫會議
数据建模介绍.
以UML探討某單位車輛派遣自動化系統-個案分析
CH03 行銷資訊系統資料庫模組--資料庫概論
1.源起 2.目標 3.為什麼要做這個題目 4.他的遊戲族群與年紀 5.它的視覺表現 6.目前獲利方式 7.結論 8.遊戲可修正處
資料庫概論 許明宗.
第4章 CSS基础 主讲人:刘泰然 经济管理学院.
网页设计与制作教程第5版 机械工业出版社同名教材 配套电子教案.
管理信息系统 第九章 面向对象的系统开发方法.
第14章 顧客資料倉儲.
部首的認識 學期:2001~2002下學期 單元(四):心理健康 班別:誠班 三水同鄉會劉本章學校 林兆祥老師製作 開始.
第七章  事业单位支出的核算      §第一节  支出概述     §第二节  拨出款项     §第三节  各项支出     §第四节  成本费用.
第十一章 物件資料結構塑模.
第6章 面向对象开发的 分析与设计.
請點選下列情境圖片選擇作答情境 情境一 小齊的網路拍賣 情境二 統一集團與捷盟物流
第 7 章 电子政府的支撑技术.
105學年度 文書組行政研習 總務處文書組 (四) 志道大樓2樓階梯教室.
資料庫應用與實作 一到六章重點、習題.
XML交易與ERP的整合 指導老師 張瑞芬 學生 g 鄧友賓 g 辛瑋雄
作業系統 Operating System 第六單元 分散式系統
高擴充高穩定高安全 企業級資料管理平台 Report Builder概論 錢曉明 資策會 資深講師 台灣微軟 資深講師.
Presentation transcript:

基于CWM的 数据仓库体系结构设计 我的论文题目是。。。 论文的内容主要是总结了我以下两个部分的工作

我的工作 提出了一个基于CWM的数据仓库体系结构 基于该体系结构,参与设计和实现了一个 电信综合业务信息服务平台 基于该体系结构,参与设计和实现了一个 电信综合业务信息服务平台 第一是基于OMG的CWM规范,提出了一个通用的、可集成的、可扩展的 数据仓库体系结构,希望能够解决不同工具之间的数据交换问题,为企业搭建统一且易于扩展的数据仓库平台提供参考 第二是参与设计和实现了一个基于该体系结构的电信企业数据仓库系统,也就是联通总部综合业务 信息服务平台。

提纲 背景介绍 数据仓库、元数据理论介绍 CWM、MOF、UML、XMI规范介绍 基于CWM的数据仓库体系结构设计 电信综合业务信息服务平台设计 这次报告主要包括以下几个部分: 首先对本论文的背景作简要的说明 然后在第二和第三部分介绍了相关的理论基础,包括:数据仓库、元数据理论,和OMG的几个相关规范。 第四部分给出了一个基于CWM的数据仓库体系结构,并详细介绍了体系结构中各个组件的功能和接口。 最后简要介绍了一个基于该体系结构的电信企业数据仓库系统。

背景介绍 数据仓库的应用越来越广泛 不同数据仓库工具之间无法进行数据交换 企业的应用受到工具的限制 利用元数据可以实现数据交换 现在对本论文的背景作一个简要的介绍, 现有数据仓库的建设一般采用单一的产品,但是每个产品都有自己的优点和缺点, 对于大型的商业应用,可能需要综合使用多种工具。而现有的数据仓库工具都采用自己 的格式表示数据和元数据,所以很难进行交换。 在这种背景下,本论文提出了一种具有标准的CWM接口的数据仓库体系结构。

提纲 数据仓库、元数据理论介绍 背景介绍 CWM、MOF、UML、XMI规范介绍 基于CWM的数据仓库体系结构设计 电信综合业务信息服务平台设计

数据仓库理论 数据仓库的定义 数据仓库的建设 数据仓库的应用 国内数据仓库建设的问题 定义:面向主题的、集成的、不可更新的、随时间变化的数据集合 主题:是在较高层次上对数据进行综合、归类并分析的抽象。面向主题的数据组织方式就是 统一地刻画各个分析对象所涉及到的各项数据,以及数据之间的关系。 模型:概念模型、逻辑模型和物理模型 建设:自底向上、自顶向下 应用:OLAP和数据挖掘 国内建设的问题:原有数据库系统设计混乱、资料积累不足、行政支持不够

元数据 定义 研究元数据的原因 描述数据的数据 管理、使用数据的需求 系统分布和互通的要求 元数据重用、共享的要求 管理、使用:当系统数据量越来越大时,使用数据的效率会降低,借助于元数据, 可以帮助用户更有效地管理和使用数据。 系统分布、互通:也就是交换数据的要求。利用元数据可以实现异质系统之间数据的交换, 这一点正是本论文设计的基础。 元数据重用、综合的要求:目前很少有单一工具能够满足大型商业应用的需求,用户常常 需要使用多种工具的组合,这样就必须实现它们各自元数据的共享。

元数据的建模和标准化 建模的两大方向 标准化 元数据参考模型 元数据模型 OMG MDC 目前,关于元数据的研究主要集中在元数据的建模上,元数据的建模主要有两大方向: 元数据参考模型:也就是提供一个连续的整体框架,为整个系统划定实现的层次结构 元数据模型:也就是元数据参考模型中的具体选定的一层。比如CWM就是这样的一个规范。 元数据的规范从内容上大致可以分为两类:元数据建模和元数据交换。 目前主要有两个组织制定了相关的规范,一个是OMG,它采用的规范包括MOF,UML和CWM, 这些规范形成了元数据定义和交换的基础。 另外一个组织是MDC,它做的主要工作是开发了MDIS,并完成了基于微软的OIM的MDC-OIM 的技术评审。 为了推动元数据标准化的发展,OMG和MDC在99年互相加入成为会员,MDC采用了 OMG的UML,OMG则将MDC-OIM中数据仓库部分的内容作为CWM的设计参考 相信在两个组织的共同努力下,元数据标准将逐步一致化。

提纲 背景介绍 数据仓库、元数据理论介绍 CWM、MOF、UML、XMI规范介绍 基于CWM的数据仓库体系结构设计 电信综合业务信息服务平台设计

元数据的层次 通用的元元模型 元元模型(M3) 元模型(M2) Record(“Student”, 模型(M1) …… Record(“Student”, Field(“name”,String), (Field(“sex”,String)…) MetaClass(“Record”, [MetaAttr((“name”),String), MetaAttr((“fields”),list<Field>)] MetaClass(“Field”,…) 通用的元元模型 信息,数据 (M0) 模型(M1) 元模型(M2) 元元模型(M3) 为了说明这几个规范之间的关系,首先向大家介绍一下元数据的层次。 OMG为元数据定义了四个层次。

OMG规范和元数据层次的关系 元数据层次 MOF术语 示例 M3 元元模型 MOF模型 M2 元模型, 元元数据 UML元模型, CWM元模型 M1 模型, 元数据 UML模型, CWM模型 M0 对象,数据 数据仓库数据

CWM和相关规范的关系 CWM和MOF的关系 CWM和UML的关系 CWM和XMI的关系 直接继承了UML核心元模型 使用UML图形标记 使用UML中的OCL(对象约束语言) CWM和XMI的关系 CWM遵循MOF规范,所以它就可以使用OMG其它基于MOF的规范,尤其是XMI,另外,还可以 直接使用MOF IDL CWM是UML核心元模型的扩展,直接使用其中定义的语法和语义,节省了很多重复工作 比如,在CWM Relational包中有两个类:table和column,分别表示任何关系型数据库中的表和字段,它们分别继承于UML元模型中的Class和Attribute,而Class和Attribute又继承于Classifier和Feature, 在UML元模型已经明确定义了它们之间的关联关系,所以在CWM就无需进行重复定义。 XMI是一个可以将MOF模型映射为XML文档和DTD的规范,由于CWM遵循MOF,所以就可以利用 XMI将CWM元模型映射为XML文档和DTD,这样,所有能够解析XML的数据仓库工具之间都可以 进行元数据交换。由于XML使用非常广泛,所以这就大大增加了CWM的实用性和数据交换效率。

CWM的组成 CWM元模型 基础包 资源包 分析包 管理包 CWM DTD和CWM XML CWM IDL

提纲 背景介绍 数据仓库、元数据理论介绍 CWM、MOF、UML、XMI规范介绍 基于CWM的数据仓库体系结构设计 电信综合业务信息服务平台设计 基于上述理论研究,并结合本人参与建设多个数据仓库项目的经验,

基于CWM的数据仓库体系结构 需要说明的是,由于图的复杂性,不方便画出各组件和CWM的关系,实际上,图中每个组件 的设计和构造都遵循CWM规范,实现并提供标准的CWM接口。它们之间的数据交换都通过 接口调用的形式实现,当需要传输大量的数据时,可以采用交换XML文档和DTD的方式,由于 这些文档都是纯文本,所以可以保证交换的效率。 图中的组件主要可以分为以下几个部分:数据源、处理工具、数据存储、元数据存储和 数据仓库管理。数据源 由图可以看出,数据经过ETL组件的处理,被装载到ODS和数据仓库中, 同时将相关的元数据存储到中央元数据库和它们各自的本地元数据库。当需要时,中央数据仓库 还可以从ODS中获取轻度综合的数据。各个数据集市中的数据只来源于中央数据仓库,这样可以严格 保持它们之间数据的一致性,避免了烟囱式数据集市。所有这些组件都由中央元数据库驱动, 这样就可以保持数据的语法和语义在整个企业级别上的完整性和一致性,从而保持统一的业务规则。 下面分别介绍各个组件的功能和它们的接口。

数据源 OLTP数据库 遗留数据 内部办公系统数据 外部数据 数据仓库的数据源主要包括四个部分:。。。

数据源 多种类型:关系型、多维、 记录、XML 以及其它一些工具类型 关系型:模式,物理表, 视图,字段,索引,触发器,外关键字 ,主关键字 ,数据类型,字段值,数据记录,记录的集合 目前的数据库有很多种实现形式,包括。。。但其中最常用的是关系型,下面就以关系型数据库为例, 介绍一下数据源的接口。

Relational元模型

Relational元模型(续1)

Relational元模型(续2)

关系型数据源的主要接口 BaseTable:查询和修改表的属性、触发器和结构 Catalog:查询和修改包含的元素 Column:查询和设置属性 Row:查询和修改一条记录的内容 RowSet:查询和修改包含的记录

ETL 读取数据 清洁数据 转换数据 装载数据

ETL组件的接口 黑盒变换: Transformation ,DataObjectSet ,TransformationUse 白盒变换: FeatureMap ,ClassifierMap ,ClassifierFeatureMap ,TransformationMap 变换的执行顺序控制: TransformationTask ,TransformationStep ,TransformationActivity ,StepPrecedence ,PrecedenceConstraint

中央数据仓库 数据粒度最细且多层次 数据是历史的 数据是时间相关的 大数据量 数据是整合的 通用的、全局的

操作数据存储ODS 操作型系统 O D S 1/2 企 业 数据仓库 特点:面向主题的、集成的、可变的、当前的或接近当前的 企 业 数据仓库 特点:面向主题的、集成的、可变的、当前的或接近当前的 作用:企业级OLTP、即时OLAP

数据集市 部门1 外 部 数据源 粒度1 部门2 企 业 数据集市 数 据 仓 库 粒度2 部门3 最细粒度 粒度3 面向部门决策支持的数据仓库 更小、更集中的数据仓库

数据集市的特点 面向部门应用 规模小,投资少 使用方便且成本低 Ø 面向部门应用:数据集市一般由各个部门按照自己特定的需求从数据仓库中抽取相关的数据搭建而成,这个部门只需从自己的角度出发,而不必考虑整个企业的需要。比如,销售部门的数据集市只包含销售方面的数据,而不会导入诸如人力资源、财务方面的数据; Ø 规模小,投资少:数据集市的数据量相对于数据仓库要少的多,各个部门可以按照自己的需求选择合适的软硬件平台,以节省投资; Ø 使用方便且成本低:各部门可以在任何时候执行自己需要的DSS处理,而无需考虑对资源的占用和对其它部门的影响

元数据库 类型: 内容: 中央元数据库 本地元数据库 抽取过程:任务、执行顺序、映射关系、转换规则 描述数据 :方位图、数据之间的商业关系、商业规则、数据的改变 数据仓库管理:安全性、运行状态、抽取过程的调度、I/O对象及其关系

数据仓库管理 访问控制和安全性管理 数据增长管理 抽取过程的管理 性能管理 故障恢复 扩充和演变管理

数据仓库管理接口 抽取过程的调度(WarehouseProcess,WarehouseEvent,InternalEvent,ScheduleEvent,ExternalEvent) 抽取过程的执行(TransformationExecution,StepExecution,ActivityExecution) 数据元素的变化(Measurement,ChangeRequest)

OLAP组件接口 立方体的定义: Cube,CubeDimAssoc,CubeRegion,Dimension,Hierarchy,Level,Mearsure, LevelBasedHierarchy,HierarchyLevelAsso, ValueBasedHierarchy,MemberSelection,MemberSelGrp, 立方体到物理数据源的映射 StructureMap, LevelBasedHierarchy, ValueBasedHierarchy

数据挖掘组件的主要类及接口 MiningModel:模型属性和模型的输入 MiningSettings:对象属性,输入参数的说明 ApplicationInputSpecification, ApplicationAttribute:使用模型时的参数 MiningModelResult:挖掘的结果 SupervisedMiningModel: 描述预言性算法产生的模型 StatisticsSettings, AssociationRulesSettings, ClusteringSettings, ClassificationSettings, RegressionSettings:对应模型的设置

基于CWM的数据仓库体系结构的 特点及优点 统一的数据集市和数据仓库 中央元数据库驱动机制 灵活高效的数据交换方式 易于升级 高度的可集成性 高度的可扩展性

基于CORBA的企业数据仓库扩展结构 对 象 服 务 企业数据仓库 平台 C W M(IDL) 通用数据仓库 工具 对象请求代理(ORB)

提纲 电信综合业务信息服务平台设计 背景介绍 数据仓库、元数据理论介绍 CWM、MOF、UML、XMI规范介绍

系统体系结构设计

系统部署图 系统目前的功能

致谢