第五章 信息与系统集成技术 概述 数据流集成技术 信息流集成技术 信息管理集成技术 流程重组与业务流程集成 企业门户集成 企业集成架构 第五章 信息与系统集成技术 概述 数据流集成技术 企业集成架构 企业数据集成 信息流集成技术 信息管理集成技术 流程重组与业务流程集成 企业门户集成 2018/11/17 信息系统集成
5.1 概述 信息与系统集成的目标 阻碍畅通的主要原因 建立良好的系统环境,使得信息共享、信息操纵、功能交互、信息服务及决策支持得以畅通。 系统的环境建立在计算机网络系统及服务系统之上,如何使信息操纵、功能交互、信息服务得以畅通,从而为决策提供良好支持是系统集成要解决的主要问题。 阻碍畅通的主要原因 分散的数据源以及数据源的异构使得数据流不能畅通。 分散的应用系统功能交互性差,使得功能交互难以畅通。 信息及信息操纵语义的不一致使得信息服务部畅通。 2018/11/17 信息系统集成
5.1 概述 信息与系统集成技术体系 信息与系统集成技术 数据流 集成技术 信息流 信息管理 业务流程 信息服务 数据库及数据仓库技术 XML技术 语义互操作技术 对象化数据操作技术 分布式对象互操作与 应用接口集成技术 工作流技术 业务流程重组技术 信息空间 与个性化 支持 建设依据 2018/11/17 信息系统集成
5.2 数据集成技术 数据库技术 人工管理—文件系统—数据库系统 数据模型 描述的是数据的组结构及数据间的相互关系,如E-R图。 概念模型到结构化数据模型的工作主要由专业人员完成。 关系模型是将实体之间的关系以及关系之间的关系用二维表及二维表之间的某种关联的方式描述。 实体1 实体2 关系 属性1 属性i 属性j 属性k 2018/11/17 信息系统集成
5.2 数据集成技术 模式和映射 概念模式也叫模式,是数据库中所有被管理数据的完整逻辑结构的描述。 概念模式是所有用户的公共数据模型,是应用系统的全局数据视图,体现在数据关系库中就是各类基本数据表的总体。 概念模式中,为了使得模型避免数据冗余、保持数据一致等方面考虑进行不同级别的规范化处理,使得模型符合某种范式。 内模式是数据库的底层描述,也称物理模式或存储模式,是数据库中全体数据的物理结构和存储结构的描述。 数据库的三级模式是对数据库中数据的不同级别的抽象,这种抽象有利于数据的物理独立性和逻辑独立性,有利于数据管理和系统扩展。 在应用系统中,应用程序与数据库交互,可以是外模式层面也可以是概念模式层面,并没有严格限定一定使用外模式。甚至为了提高数据访问效率,多数采用基于基本数据表进行数据的各种操作,而用户数据的组织由应用程序来完成。 2018/11/17 信息系统集成
5.2 数据集成技术 DBMS功能 DBMS是以数据库为管理对象的数据管理软件,它的核心作用是利用数据库实现科学地组织和存储数据、高效地获取和维护数据。 数据结构定义:依据某种数据定义语言定义数据库结构及逻辑关系。 数据库的数据操纵:实现对数据库中的各类操作。 数据的安全控制:通过用户权限的设置,来管理数据库数据的各类操纵。 数据的完整性控制:保证数据库中数据的正确和有效。 数据的并发控制:提供多用户的共享访问并防止访问中的各类错误发上。 数据库的维护:包括数据备份、恢复以及性能监测等功能。 2018/11/17 信息系统集成
5.2 数据集成技术 数据仓库技术 数据仓库(data warehouse, DW)技术是数据库技术的进一步发展。 传统的数据库技术主要是面向事务性应用,称为联机事务处理OLTP,主要目标是高时效性,对业务活动能够及时响应。 数据仓库是为了解决从海量的信息资料中得到对管理、决策有益的信息而产生的。 2018/11/17 信息系统集成
5.2 数据集成技术 什么是数据仓库 面向主题:主题指的是用户所关心的领域问题,是与管理、决策相关的某一类别事物的标识。 具有集成特性:利用现存的分散数据进行决策支持,即从分散异构的数据源中取得决策所需要的信息。 动态性:体现了管理、决策对象的动态特性。动态性体现在数据与事物的活动特征、变化趋势等关联方面。 相对稳定性:体现了数据仓库中的数据是相对不变的,一般情况下只能追加,而不允许修改。数据仓库中保存了应用系统的历史数据,而不是正在发生的多变业务数据。 数据仓库主要是对管理、决策的支持,支持的方式是提供多种查询手段和丰富的、多角度的信息分析展示服务能力。 2018/11/17 信息系统集成
5.2 数据集成技术 数据仓库采用的数据模型 数据仓库是面向主题的数据组织方式。数据仓库的高层数据模型一般被称为多维数据模型。维指的是观察事物的不同角度,即用户关心的问题层面。维是具有层次结构的对主题信息的某种划分,层次中水平层是相同级别的归类,垂直层是逐步细化和深入。 多维数据构成主题信息的立体结构,不同主题之间,涵盖的数据可能存在交叉,因此完全按照主题来构造数据的存储模型会造成过多的冗余。 数据仓库中数据具有多层结构。 2018/11/17 信息系统集成
5.2 数据集成技术 图中表示了数据仓库的数据来源、数据不同层面的概括。数据仓库的来源数据一般是企业各类应用系统数据库或文档等。这些数据都是与业务有关的历史数据。 数据仓库事实数据是从历史业务数据的抽取,该数据与应用系统中的业务数据具有直接对应关系。 联邦数据库策略,采用虚拟存储方式,数据实际上存在于各个应用系统中,数据仓库中数据只是利用一系列规则从不同的数据源构造的用户级视图。 利用关系数据库建立数据仓库的实际数据库,存储从不同应用获取的数据,这些数据是已经经过加工处理为同一的数据模型,并经过数据质量检验达到在表示、内容上一致的数据。 轻度数据综合及高度数据综合是围绕主题进行的不同层面的概括,是围绕主题数据的逻辑数据结构。 2018/11/17 信息系统集成
5.2 数据集成技术 元数据 由于存在多级的数据抽象,在数据仓库中元数据成为重要的系统数据。 传统数据库中,元数据主要是数据字典,用于描述数据的结构、数据间关系、数据的逻辑组织、存储方式、各级模式及映射关系等内通,是数据库管理系统管理控制数据的依据。 数据仓库的元数据除了具有与数据库数据字典内容相同外,还应该包含数据仓库自身的特定信息:主题描述、外部数据和非结构化数据描述、记录系统定义、逻辑模型定义、数据抽取历史、粒度定义、数据分割信息、索引定义等。 元数据贯穿数据仓库操作的各个环节,是数据仓库运作的基础,因此元数据管理是数据仓库管理中的重要内容。 2018/11/17 信息系统集成
5.2 数据集成技术 数据仓库的体系结构 应用系统 OLAP工具 查询分析:面向主题、多角度、多层面、丰富的信息展示形式 数据挖掘工具 业务数据 数据源访问接口 数据仓库数据 元数据 数据仓库使用接口 应用系统 OLAP工具 数据挖掘工具 数据仓库管理:元数据及数据模型建立,数据存储与检索、概括聚集、模式映射等 查询分析:面向主题、多角度、多层面、丰富的信息展示形式 数据获取:抽取、转换、清洗、整理、归并、质量检查、复制、装载等加工处理过程。 2018/11/17 信息系统集成
5.2 数据集成技术 数据库操作接口 开放数据库连接ODBC的体系结构: 数据源1 数据源n 驱动程序1 驱动程序n ODBC驱动管理程序 应用程序1 应用程序n 本地或网络平台 2018/11/17 信息系统集成
5.2 数据集成技术 Java数据库连接JDBC的体系结构 应用程序1 应用程序2 应用程序n JDBC API JDBC驱动管理器 JDBC-ODBC桥 虚拟驱动程序 网络驱动协议 纯Java驱动 中间层 驱动程序 数据源 2018/11/17 信息系统集成
5.2 数据集成技术 XML技术 XML的特点 XML是标准的文本,因此在跨程序设计语言、跨平台等方面具有优势,可以被任意支持文本读写的应用程序所识别。 XML是得到广泛支持的国际标准,如J2EE,.NET等均支持XML,因此XML的使用不存在开发工具的障碍。 XML语法简单,容易理解,易于使用。 XML具有良好的可扩展性,可以用XML根据应用领域中信息表述的需要灵活定义领域内的信息描述,易于按照主题交换数据,可表达信息语义。 XML可描述结构化及半结构化数据,在数据描述上功能强大,可描述复杂结构的文档数据,也易于对数据的封装、发布。 XML支持对文档的丰富查询方式,方便信息的多样化查询。 XML文档易于应用程序语言的解析。 2018/11/17 信息系统集成
5.2 数据集成技术 XML文档结构 其中元素内容可以是空的称为空元素。标签可以增加属性,标签书写时不允许交叉,即元素之间要么并列,要么嵌套。 2018/11/17 信息系统集成
5.2 数据集成技术 数据流集成及技术应用 数据流集成是在相互连通的不同计算机系统之间,通过网络通信协议实现数据流的流通。 数据流的主要内容概括为: 建立面向企业全局的统一的数据模型 建立局部数据模型与全局数据模型之间的转换机制。 整理分散数据源中的数据,使得数据在全局模型下保持一致。 建立集成系统的中心数据库 完成分散数据源中的必要数据到集成系统中心数据库的导入。 构建统一的数据表达和数据访问机制。 2018/11/17 信息系统集成
5.3 信息流集成技术 数据是信息的载体,数据流集成实现了数据在表达上的一致和畅通的传递与交换。 语义互操作技术 元数据与语义描述 集成系统中院数据可分为两类:系统元数据和领域元数据。 系统元数据是集成系统中不同数据源数据存储管理、各类数据源的数据逻辑结构、局部数据与全局数据之间的映射关系、不同数据源的位置及连接方式等方面的描述。 领域元数据是集成系统中面向领域的问题抽象。使用数据仓库技术的数据模型中需要描述主体结构及主体与关系标的关系结构、局部信息应用结构、面向角色的信息空间结构等。数据来源于企业的概念模型。 2018/11/17 信息系统集成
5.3 信息流集成技术 RDF资源描述框架 RDF是Web资源描述语言。提供了对网络资源的一致化描述方法,是针对Web资源的有效元数据描述方案。 RDF的基本模型可描述为资源(resource)、属性(property)、属性值(value),资源是可以唯一标示的任意事物,属性是事物的特性以及事物之间的关系等,值是属性的内容。 属性 资源 属性值 主体 谓词 客体 2018/11/17 信息系统集成
5.3 信息流集成技术 对象数据操作技术 对象化程序设计使得程序易于理解,维护方便,并且代码的重用性高,适合大型的软件开发。然而,应用系统的核心部分目前仍然以关系数据库为主,应用系统在于数据库打交道的时候,不能避免关系模型,要求程序员完全理解数据库结构,否则,无法使用数据库的组件。 因此程序在可读性、可维护性、可重用性和可移植性等方面大打折扣。 2018/11/17 信息系统集成
5.3 信息流集成技术 对象-关系映射及数据对象 对象数据操作的真正含义是将关系数据库中的数据变成应用系统中的对象,具有对象的所有特征,应用系统的其他部件与这种对象交互时可以不去理解数据库的结构问题,可以象普通对象一样使用和交互。 关系数据库 对象模 型与关 系模型 之间相 互映射 数据对象 业务对象 2018/11/17 信息系统集成
5.3 信息流集成技术 数据对象的持久性 在对象数据操作技术中,除了解决模型映射之外,更重要的是持久性的实现,数据库数据存储于可长期保存的物理介质中,称为持久性数据。 持久性体现在数据不受应用程序执行的影响,一直保持与数据库中数据的一致。 应用系统访问数据对象,如同访问数据库一样,数据对象能够保持其他对象在上次操作交互中结果数据的延续。 因此数据对象也要求具有与数据库一样持久保持自己的能力,在即使是数据对象赖以存在的系统环境,因为某种原因重新启动,数据对象也能恢复到系统故障前的运行状态和当前保存的数据,而不是仅仅存在于内存和应用程序的执行周期内。 与数据库连接的数据对象除了持久性问题解决之外,还需要解决其他数据管理问题,如安全、连接池和事务等。 2018/11/17 信息系统集成
5.3 信息流集成技术 基于EJB的对象数据操作技术 EJB是Java分布应用组件技术规范,利用EJB规范可构造出某种用途的EJB组件。 JDNI EJBHome EJBObject EJB 实例 远程Home 接口 远程对象 客户程序 数据库 远程交互 EJB容器 2018/11/17 信息系统集成
5.3 信息流集成技术 客户端与EJB实例的交互过程如下: JDNI EJBHome 远程Home 接口 EJB实例 远程对象 接口 1) 2) 客户程序 4) 3) EJBHome 远程Home 接口 5) 6) EJB实例 7) 9) 远程对象 接口 8) 10) EJBObject 11) 12) 2018/11/17 信息系统集成
5.4 信息管理集成技术 信息流的集成解决了企业内部信息交换的畅通,并且依据对象化数据操作,使得系统间内部对象之间的信息交换在更高层面进行,屏蔽了底层的数据模型的异构特性。 但是,信息的传递是有目的、有次序的、有时效性的、有可靠性的要求的过程。 信息的操纵在系统当中体现为应用程序的功能逻辑,这些功能逻辑往往被封装为对象或应用组件。因此解决信息操作的管理与控制需要解决两个问题。 功能是可以跨不同应用系统引用的 功能引用是基于规则的 在集成系统构造中,各个子系统的功能逻辑被封装为分布式对象,从而按照分布式对象策略实现功能的相互引用。在EAI中,解决这一层面的集成被称为应用集成或应用接口集成。 2018/11/17 信息系统集成
5.4 信息管理集成技术 分布式对象互操作技术 CORBA的体系结构 结构中定义了一个框架,使客户机能通过它向远程对象透明地发送请求并得到响应,从而能在异构的计算环境下实现可重用、可移植和可互操作的软件。 ORB内核 IDL桩 DII ORB接口 ORB适配器 IDL框架 DSI 对象(服务器) IIOP/GOIP 客户机 实现库 IDL编译器 接口库 Obj Ref 2018/11/17 信息系统集成
Remote Reference Layer 5.4 信息管理集成技术 RMI RMI( remote method invocation)远程过程激发是两个不同程序之间的对象方法调用。 RMI体系结构分为:桩/框架层、远程参考层和传输层。 RMI的重要思想是接口与实现的分离。 RMI工作原理 服务器端为了能够让对象提供服务,将对象注册到RMI Registry实体中,RMI Registry对系统端口进行监听,捕获客户程序的请求。 客户程序定位远程服务所在的虚拟机的过程可通过提供完整的URL来实现。 Transport Layer Remote Reference Layer Stubs & Skeletons Client Program Server Program 2018/11/17 信息系统集成
5.4 信息管理集成技术 DCOM( Distributed component object model) DCOM是支持网络环境中COM进行LPC的网络协议,为了互操作安全,DCOM使用WindowsNT的安全体系来保障,DCOM充分利用了现有的系统资源来完成分布式互操作。 安全提供者 DCE RPC COM运行库 客户程序 组件 DCOM 网络协议 2018/11/17 信息系统集成
5.4 信息管理集成技术 主流分布对象技术的比较与发展 CORBA、COM/DCOM和JAVA/RMI主流技术中CORBA最为学术界推崇,CORBA大而全,具有良好的跨平台性、强大的编程语言支持和安全性能,是发展最早也是最完善的。 COM/DCOM技术的最大缺点就是其跨平台性较差,如何实现与其他技术的互操作性始终是一大难题。 RMI是一种纯Java解决方案,由于Java的跨平台性很好,因此RMI可以在不同平台之间无缝运行,但是RMI对多语言集成的支持却很弱,因为RMI两端必须是Java程序,如果需要用它集成非Java系统,就必须在非Java系统所在的机器上用Java对它进行封装。 目前三种技术为了克服各自的缺点正向着不同的方向努力,CORBA发展出实时应用、安全的CORBA、嵌入式应和移动计算中的应用等;COM/DCOM推出了COM+;Java融合了CORBA的优点,建立在CORBA的ORB通信机制HOP之上,通过HOP协议,EJB可以和非Java客户机进行通信;J2EE已经成为企业级计算的一大标准,同时也是Sun One的核心技术之一。 2018/11/17 信息系统集成
5.4 信息管理集成技术 应用接口集成技术 消息队列中间件 Message-oriented middleware是客户机/服务器基础平台,目的是增强应用程序的互操作性、适应性和可移植性。实现分布式异构平台的应用程序之间的通信。 MOM的各项功能是通过API获取的,利用消息队列来临时保存消息,从而实现异步通信。 消息队列中的消息可以包含多种类型的数据,当接收方能够接受消息,则消息队列中等候的消息就会立刻送出。 2018/11/17 信息系统集成
5.4 信息管理集成技术 远程过程调用RPC 对象请求代理ORB 应用接口集成技术 采用请求-响应的通信模式。 负责管理和支持分布式对象或组织之间的通信。实现了位置透明、编程语言透明、协议和操作系统的透明。 有三个主要标准:OMG CORBA ORB标准、Java RMI和RMI-IIOP、Microsoft COM/DCOM/ COM+。 应用接口集成技术 常用的包括集成适配器、消息代理、集成面板、集成代理四种,每种集成模式都是对具有业务功能依赖关系的多个应用之间互操作性实现方式的总结。 具体应用中集成模式可能以某种变形的形式出现。 2018/11/17 信息系统集成
5.4 信息管理集成技术 适配器集成模式 消息代理集成模式 面板集成模式 原理是将已有的遗产应用的接口转换成一种可以访问的接口形式,若遗留系统需要与其他应用系统进行集成时,可以直接利用相应的适配器提供的接口来完成。 消息代理集成模式 消息代理集成模式下,由应用系统自己完成应用交互逻辑的定义和实现,消息代理只负责在不同的应用之间传递符合一定形式语法的消息,而对其中的应用集成语义不负责进行解释。 这种模式采用三种通信模式实现应用间的信息交互:一对一同步集成;一对一异步集成模型;一对多异步集成。 面板集成模式 从应用交互实现的层面来描述客户端应用和服务器端应用集成的一种方法。在这种模式中包含一个或多个客户端应用、一个集成面板、一个或多个服务器端应用。 2018/11/17 信息系统集成
5.4 信息管理集成技术 代理集成模式 在代理集成模式中,由于不存在很明显的客户端应用和服务器应用的划分,它仅需要将待集成的应用间的交互逻辑从应用中分离出来,并对应用间的交互逻辑进行封装,进而由集成代理来引导多个应用之间的交互。 采用这种集成方式的好处有: 对遗留应用的依赖及影响最小。 由于交互逻辑以集中的方式表达而不是分布在需要集成的应用中,所以采用这种方式进行集成后形成的集成系统比较容易维护。 根据封装的应用交互逻辑可以很方便地创建可重用应用服务。 2018/11/17 信息系统集成
5.4 信息管理集成技术 工作流技术 工作流管理联盟(Workflow Management Coalition ,WfMC)将工作流定义为业务流程的全部或部分自动化。在此过程中,文档、信息或任务按照一定的过程规则流转,实现组织成员间的协调工作以达到业务的整体目标。 简单地说,工作流就是一系列相互衔接、自动进行的业务活动或任务。 工作流的体系结构包括:工作流控制数据,工作流相关数据,工作流应用数据,过程建模工具,工作流执行服务工作流机,工作流机,工作流客户应用,工作流执行服务之间的互操作,系统管理和监控工具以及WAPI与接口。 工作流管理联盟提供了四种可能的通过任务表来实现工作流客户对活动进行的控制:基于主机方式的模型,共享文件库模型,电子邮件模型,过程调用或消息传递模型。 从业务流程的角度,系统可以被视为由多个相互关联的不同层次的过程所组成的网络,在业务流程集成中可将这些过程视为多个相关的工作流。 2018/11/17 信息系统集成
5.5 流程重组与业务流程集成 业务过程重组意味着对业务流程进行重新思考与再设计。流程重组的目标是设计一个“更好”的工作系统,流程优化策略依赖于重组的目标,如降低业务成本、提高产品和新服务等。 工作流 描述 工作流执行 业务流程 新业务流程 2.业务过程 3.工作流执行和自动化 1.流程建模 2018/11/17 信息系统集成
5.5 流程重组与业务流程集成 工作流管理过程可以支持业务流程及信息过程重组,包括: 业务流程建模及工作流描述 业务流程重组 工作流执行和自动控制 2018/11/17 信息系统集成
5.6 企业门户集成 信息空间 主题划分策略 信息空间与全局数据的映射 角色的业务活动 角色的工作任务 角色的协作对象 角色的服务对象 2018/11/17 信息系统集成
5.6 企业门户集成 个性化交互界面 向导及简单的操作地图 提醒和任务安排 界面学习和自组织 对于复杂的交互过程适合采用操作向导,将交互活动归类为不同的向导,并支持分支、选择等策略,方便用户完成交互的目的。 提醒和任务安排 每一个角色承担的任务可能是多个,不同的任务可能存在时间要求,也有其他角色传递来的任务处理请求等,应用系统应该将任务进度及其他任务请求及时提醒用户。 界面学习和自组织 依据用户经常性的操作,可以进行简单的统计学习,并依据任务安排及任务处理流程,自动组织相应的操作界面。 2018/11/17 信息系统集成