|
简介
在许多相关的业务过程中,客户、产品、账户、合同和地区等实体扮演主要角色。这些实体称为主数据。在当今的许多公司中,质量很差的主数据分散在不同的应用领域中,这给公司带来很多麻烦。改进主数据质量并更高效地管理主数据,从而优化业务过程,这就是 Master Data Management (MDM)。例如,通过对产品主数据领域应用 MDM,优化 New Product Introduction (NPI) 业务过程。
已经有许多资料讨论 MDM 的概念以及它的重要性。因此,本文的主要目标是通过介绍 MDM Reference Architecture 更具体地帮助 IT 架构师设计 MDM 解决方案。但是,在开始讨论 MDM Reference Architecture 之前,先定义一些术语。
术语
首先,一定要理解使用方法。对于客户、产品、账户、合同和地区等主数据领域,有几种描述如何创建、维护和使用这些主数据实体的模式。这些不同的使用方法类型称为使用方法。使用方法包括以下几种:
-
协作性使用方法:协作性意味着多个用户(常常具有不同的角色)参与与一个主数据实体相关的同一过程。一个典型示例是产品主数据,商品专家、品牌经理、定价专家和翻译通常要协作编写新产品的定义。协作性使用方法的关键需求是包含签入/签出功能的工作流支持、关系支持和产品层次结构管理。从安全性的角度来看,必须跨所有功能(比如工作流、关系和层次结构管理)实现属性级的特权授权粒度。
-
操作性使用方法:在 MDM 系统必须作为 Online Transaction Processing (OLTP) 服务器的情况下,这种使用方法很重要。通常情况下,许多应用程序和用户都需要快速访问主数据,他们通过 “New Account Opening” 等业务过程调用 MDM 服务以获取和修改主数据。在 SOA 环境中常常使??? MDM 服务,要求能够通过各种接口访问这些服务。支持这种使用方法的 MDM 系统可能需要支持每秒对数百万主数据记录执行几百个事务。关于操作性使用方法的更多信息,请参见 参考资料。
-
分析性使用方法:这种使用方法有三种已知的子类型:
-
身份分析:这种子类型常常用来判断或检验身份和发现隐藏的关系。
-
对主数据的分析:支持这种分析的 MDM 系统能够回答 “昨天新增了多少位客户?” 或 “上周有多少位客户修改了地址?” 这样的问题。
-
与数据仓库的分析集成:首先,MDM 系统把主数据提供给数据仓库,提高数据仓库环境的精确性。在这种分析性使用方法的子类型的第二步中,把在数据仓库中发现的信息反馈给 MDM 系统,以便在 IT 领域中使用这些信息。这种分析性使用方法的一个示例是,把计算出的客户赢利贡献率指标和客户潜力指标保存在 MDM 系统中,这样 MDM 系统就能够向所有办公系统提供这些数据。
主数据通常分散在企业中的多个数据源系统中,这会导致主数据不一致、不完整且质量差。实现 MDM 系统就是为了解决这些问题,并提供把主数据分发给异类环境中各种应用程序的能力。要想把主数据分发给其他系统,就必须满足许多不同的业务和技术需求。这些需求还会随时间变化,所以在许多情况下在企业中引入 MDM 往往不是一次性的项目。由于存在这些原因以及上面描述的多种使用方法,MDM 系统有不同的实现风格,它们分别应对不同的需求。企业常常先以一种风格实现 MDM,然后逐渐改进 MDM 的实现,从而不断提供业务价值。MDM 的三种实现风格是:
-
注册风格:这种风格为只需要读主数据而不需要修改的下游系统提供主数据的只读视图。这种实现风格有助于消除重复的数据并(在许多情况下通过联合)提供一致的主数据访问路径。MDM 系统中的数据常常只是所有主数据属性的一小部分,必须通过这些属性向包含完整主数据记录的应用程序传递惟一性和交叉引用信息。在这种场景中,主数据的所有属性保存在应用程序系统中,没有经过整理,质量仍然很差,只是把部分属性保存在 MDM 系统中了。因此,MDM 系统中主数据的属性既不一致,也不完整。这种风格的优点是,与其他实现风格相比,常常更容易部署,成本更低。另外,这种风格在 IT 领域中提供所有主数据记录的只读视图,对应用程序系统的干扰比较小。
-
共存风格:这种风格把所有主数据属性完全保存在 MDM 系统中。在 MDM 系统和应用程序系统中都可以修改主数据。从完整性方面来看,所有属性都在 MDM 系统中。但是,从一致性方面来看,只提供收敛一致性。原因在于,在应用程序系统中更新主数据和把更新发送(同步)给 MDM 系统之间有延迟。这意味着一致性问题还没有解决。传播时间窗越小,这种实现风格就越接近绝对一致。部署这种风格的成本比较高,因为需要整理和清理主数据模型的所有属性,然后把它们装载到 MDM 系统中,这会增加主数据集成阶段的成本。另外,MDM 系统和修改主数据的应用程序系统之间的同步也有成本。但是与注册风格相比,这种风格有多个优点:显著提高主数据的质量。因为不再需要联合,对主数据的访问常常更快。更容易部署协作编写主数据的工作流。更容易生成主数据报告 —— 因为所有主数据属性都放在一个地方。
-
事务风格:这种风格可以确保主数据在任何时候都是一致、精确且完整的。它与共存风格的主要差异是,对主数据的读写操作都通过 MDM 系统执行。这意味着,所有需要修改主数据的应用程序都必须通过调用 MDM 系统提供的 MDM 服务来完成修改。因为修改的主数据的传播不再有延迟,所以主数据可以实现绝对一致性。部署这种风格的 MDM 解决方案需要深入到应用程序系统内部。系统拦截业务事务的方式使应用程序可以与 MDM 系统交互,以更改主数据或部署全局事务机制(比如两阶段提交基础结构)。
MDM 的参考体系结构应该能够支持上述所有使用方法和实现风格。其他文档更详细地讨论这三种实现风格(见 参考资料)。
什么是参考体系结构?
参考体系结构是多个解决方案体系结构的抽象,它们已经在实践中成功地部署,解决了相同类型的业务问题。参考体系结构把在这些实现中获得的知识、模式和最佳实践集中在一起。一些参考体系结构是跨行业的,而其他参考体系结构可能针对特定的行业。参考体系结构以一种通用的格式提供详细的体系结构信息,这样就能够以一致、高质量且可支持的方式重复地设计和部署解决方案。参考体系结构描述主要的功能组件,比如用于端到端解决方案体系结构的体系结构构建块。早在解决方案的分析和设计阶段,IT 架构师就可以寻找适当的参考体系结构,然后以参考体系结构作为设计解决方案体系结构的基础。参考体系结构提供一个用于确定项目范围、评估差距和评估风险的框架,可以为设计和实现解决方案开发一个路线图。
使用参考体系结构有以下好处:
-
分隔关注点:好的参考体系结构使用关注点分隔原则构建组件。采用关注点分隔原则意味着,对一个组件的修改对其他组件的影响非常小,甚至没有影响。这样就可以形成灵活且可扩展的基础结构。
-
降低风险:许多实现和部署已经在没有参考体系结构指导的情况下完成了。因此,如果需要完成相同领域中的新项目,而且可以使用参考体系结构明确关键的概念和功能,就可以通过重用已经证明有效的体系结构基础,满足当前项目的需求,从而降低风险。
-
降低成本:因为不需要从头开发解决方案体系结构,所以会降低解决方案的开发成本。通常情况下,做出关键的体系结构决策需要大量时间,要反复讨论需求,考虑不同的选择。使用参考体系结构作为指导可以节省大量时间,从而降低成本。
-
简化决策过程:参考体系结构中的业务视图描述了基于参考体系结构选择解决方案会有哪些好处,便于设计师做出决策。
-
提高部署速度:参考体系结构还描述用于开发解决方案的关键原则、体系结构决策、部署场景和方针。它提供体系结构构建块和组件的示例,有助于选择软件产品以及产品或应用程序之间的互操作性需求。这会提高解决方案的总体部署速度。
MDM Reference Architecture
本节简要介绍 MDM Reference Architecture (RA)。在 参考资料 中可以找到完整的描述、对组件的详细描述和组件交互演示。
MDM Reference Architecture 是一种不限制行业和产品的参考体系结构,支持多种 MDM 使用方法(协作性、操作性和分析性)和多种实现风格(注册、共存和事务风格)。它有助于设计包含 MDM 功能的业务解决方案。“不限制行业” 意味着这个参考体系结构包含适用于多个行业的知识、最佳实践和模式,这些是通过研究和分析在多个 Customer Data Integration 和 Product Information Management Solutions 中部署 MDM 的情况得出的经验。我们对从这些实现产生的知识和模式进行抽象,开发出 Master Data Management RA,以在实现 MDM 功能的企业中将 MDM 描述为 MDM 解决方案。
根据 MDM RA 设计出的 MDM 解决方案可以帮助企业为整个企业内和企业外的所有参与者(用户和应用程序)治理、维护、使用和分析完整、上下文相关且精确的主数据。参与者因行业和读者的背景而异。但是在本文的讨论中,参与者包括企业内的业务线 (LOB) 用户和数据分析师,以及与企业有业务关系的商业伙伴和代理商。关于 MDM 的一个关键概念是,实现 MDM 解决方案并不仅仅是在企业中维护一个权威性的主数据中心存储库。MDM 还为企业提供以下好处:
- 能够生成实现主数据治理策略的操作,帮助管理和控制主数据的质量
- 建立数据标准,并且允许清理当前操作中使用的主数据,在整个企业的操作性环境中提高数据质量和一致性
- 对整个企业中使用主数据的方式进行标准化,把主数据当作一种独特的企业资产对待,在结构化和非结构化数据之间建立联系,从而产生业务价值
- 为新的和现有的应用程序提供权威性的主数据数据源,建立主数据生命周期管理方针
- 通过数据提供高价值且可操作性强的服务,可以根据主数据实体的变化探测和生成业务操作,从而产生业务价值
体系结构原则
体系结构原则是全面和基础性的规律、原理或假设,它为开发解决方案指明方向。良好的体系结构原则不会由于技术的发展而过时,而且应该具有客观的依据。在开发 MDM 解决方案时,应该以下面这些核心体系结构原则指导开发:
- MDM 解决方案应该能够把信息与企业应用程序和过程分隔开,使信息成为供企业使用的战略性资产。这是 Information on Demand 的基本概念之一,它基于面向服务原则,其目的是在适当的时间在适当的上下文中向适当的应用程序或用户提供信息。
- MDM 解决方案应该为企业提供主数据的权威性数据源,可以跨整个企业以标准化的方式管理信息的完整性并控制主数据的分发,从而促进重用。这条原则的主要目的是集中地管理主数据,从而降低数据管理成本并提高数据的精确性和完整性。
- MDM 解决方案应该提供灵活性,从而适应主数据模式、业务需求和法律法规的变化并支持添加新的主数据。这会提高企业快速响应业务变化的能力,支持添加新的主数据元素或修改现有的主数据。
- 在设计 MDM 解决方案时,应该高度重视在整个数据生命周期中维护数据的所有者、完整性和安全性。这条原则的目的是,确保对于企业的成功至关重要的核心业务数据是可靠的,而且符合私密性法律法规的要求。
- MDM 解决方案应该基于行业普遍接受的开放计算标准,从而支持通过多种技术与企业内外的各种系统进行交互。这条原则要求体系结构的开发保持开放性和灵活性,这样就可以轻松地与企业中现有的各种厂商软件和未来可能出现的任何 “未知技术” 集成。
- MDM 解决方案应该基于体系结构性框架和可重用的服务,从而利用企业中现有的技术。这条原则要求体系结构决策利用现有的技术投资,比如利用现有的连接、互操作或信息集成技术帮助实现 MDM 解决方案。
- MDM 解决方案应该支持以渐进方式实现 MDM 解决方案,从而让 MDM 解决方案能够立即体现出价值。
MDM Logical Systems Architecture
MDM 能够实现适用于许多行业的解决方案,比如银行、保险、零售、医疗保健、电信和政府机构。MDM Reference Architecture 能够帮助企业实现灵活且具有适应性的体系结构,确保为企业提供高性能和持久的价值。这个参考体系结构提供一个组件框架,这些组件可以管理主数据的生命周期、数据的质量和完整性,提高主数据的可操作性,并通过无状态服务控制数据的消费和分发。它的设计遵守前面描述的核心体系结构原则,明确指出了体系结构构建块中的关键软件组件,描述了每个软件组件的基本责任。
MDM Logical Systems Architecture(见下图)在设计时也考虑到了灵活性,它提供支持多种实现风格和多种 MDM 体系结构集线器模式所需的功能:
- 事务实现风格,可以使用 SOA 技术在处理应用程序事务的过程中访问主数据服务。
- 共存实现风格,使用发布/预订等技术在整个企业中协调数据。
- 注册实现风格,只为每个主数据记录维护最少量的属性,并提供到源系统中主数据的链接。
MDM Logical System Architecture 见图 1:
图 1. MDM Logical System Architecture
外部参与者可以通过多个渠道访问和更新主数据。客户可以通过业务系统(比如提供用于购物和网上银行的自助服务功能的业务系统)访问和更新主数据,还可以使用电话系统访问和更新个人信息。来自供应商、商业伙伴和业务伙伴的供应链数据可以参与 B2B 事务,从而交换客户和产品数据等核心主数据实体。多个分支机构的代理代表公司执行业务,他们可以通过公司提供的业务系统或通过 B2B 事务访问和更新主数据。通常情况下,业务系统用户通过各自的业务系统更新和查询主数据。根据 MDM 使用方法和实现风格的不同,业务系统在处理业务事务的过程中或在完成事务之后请求 MDM 服务。应该根据对非功能性需求(比如性能和可用性)的分析决定是在处理业务事务的过程中,还是在系统已经完成事务之后访问 MDM 服务。业务系统和伙伴系统通过连接和互操作层中提供的功能请求 MDM 服务,从而访问主数据。
可以通过访问第三方数据服务供应商(比如 Dun and Bradstreet、Acxiom 和 Lexis Nexis)获取关于人员或组织的更多信息,从而补充 MDM 系统中的主数据。根据业务需求,可以使用这些组织提供的数据支持把主数据装载到 MDM 系统中或定期更新数据,或者在事务中使用这些数据。政府机构还提供监视对象清单,可以使用这些清单帮助防止违法行为、反恐和反洗钱。
连接和互操作层有助于企业与商业和业务伙伴之间的通信、企业中系统之间的通信以及与外部数据供应商的通信。许多 IT 组织已经认识到需要减少系统之间点到点接口的数量,从而降低企业的复杂性并提高可维护性。因此,他们使用 Enterprise Application Integration Hubs 等应用程序集成技术实现这个层,支持通过消息传递进行通信或者使用企业服务总线。MDM 和 Information Integration Services 提供可以通过这一层调用的信息服务。连接和互操作层代表企业服务总线体系结构构造,它提供各种服务以及异步和同步集成功能,比如消息仲裁和路由、发布/预订、FTP 以及通过 Web 服务实现的面向服务集成。服务集成意味着可以从任何业务系统直接请求 MDM 和 Information Integration Services,不需要通过连接和互操作层。
在图中连接和互操作层下面是 MDM 服务体系结构构建块。它由一组 MDM 服务组成,这些服务划分为以下软件组件:
-
Interface Services 通过消息传递、方法调用、Web 服务和批处理等技术为 MDM 服务提供一个一致的入口点。在批处理期间和处理事务期间应该调用相同的 MDM 服务,从而维护和应用一致的业务逻辑。
-
Lifecycle Management Services 管理主数据的生命周期,为 MDM 系统管理的主数据提供 CRUD(创建、读取、更新和删除)支持,根据数据的上下文应用业务逻辑。Lifecycle Management Services 通过调用 Data Quality Management Services 实施数据质量规则,执行数据清理、标准化和协调。通过调用 MDM Event Management Services,探测任何根据业务规则或数据治理策略应该触发的操作。
-
Hierarchy and Relationship Management Services 管理主数据的层次结构、分组和关系。这些服务还通过请求 Identity Analytics Services 发现实体(比如人员)之间不明显的关系,然后把这些信息存储在 MDM 系统中。
-
MDM Event Management Services 用于为信息提供可操作性,根据在数据中探测到的事件触发操作。可以根据业务规则或时间日期计划定义事件,从而支持数据治理策略,比如管理对关键数据的修改。
-
Authoring Services 提供的服务用于编写、批准、管理、定制和扩展主数据的定义,以及添加或修改实例主数据,比如产品、厂商和供应商。这些服务支持 MDM 协作性使用方法,可以在协作性工作流中调用它们,从而创建、更新和批准主数据定义或实例主数据。
-
Data Quality Management Services 检验和实施数据质量规则,对数据值和结构执行数据标准化,执行数据协调。这些服务可能请求 Information Integration Services 体系结构构建块中的 Information Integrity Services。
-
基本服务用于支持安全性和私密性、搜索、审计日志记录和工作流。基本服务可以与支持工作流、安全性和审计日志记录的通用企业组件集成。
-
Master Data Repository 包含主数据(实例和定义)、MDM 系统的元数据以及修改主数据的历史记录。对于应该在企业范围维护的引用数据,还可以使用 MDM 服务维护和控制它们的分发。
Information Integration Services 提供 Information Integrity Services、ETL 服务和 EII 服务,支持对分散在不同数据源中的结构化和非结构化数据执行联合查询。Information Integrity Services 包括数据分析、清理、数据标准化和匹配服务。数据分析服务对于了解主数据的总体质量非常重要,有助于定义数据检验、数据清理、匹配和标准化逻辑,从而提高主数据的质量和一致性。MDM Data Quality Management Services 可以通过请求 Information Integrity Services 对 MDM 系统从业务系统接收到的主数据更新进行标准化、清理和匹配。ETL 服务支持从一个或多个源系统提取、转换和装载数据,从而满足一个或多个目标系统(比如数据仓库或 MDM 系统)的需要。用于装载大量数据的初始和增量 ETL 处理显示在 MDM Logical System Architecture 图的底部。支持传输少量数据的异步和同步通信技术可以在连接和互操作层中实现。
Analysis and Discovery Services 体系结构构建块包含一个 Identity Analytics 组件,这个组件提供的分析服务可以判断人员的真实身份。还可以使用这些服务发现人员之间以及人员与组织之间不明显的关系,比如属于同一家族但姓名和地址不同的人。MDM Hierarchy and Relationship Management Services 可以请求这些服务,然后把结果存储在 MDM Data Repository 中。为了让 Identity Analytics Services 能够有效地发现人员的关系和真实身份,可能需要从外部数据源装载数据并与企业中的数据一起分析。可以使用 Information Integration Services 把数据装载到 Identity Analytics 组件中。
Analysis and Discovery Services 体系结构构建块还包含其他组件,它们能够帮助企业适应市场的变化。Operational Intelligence 组件中的服务提供基于事件的分析功能、场景分析功能以及感知和响应功能。它可以使用信息和过程模型作为输入,实现这些服务的分析功能。Query, Search, and Reporting 组件提供的服务支持特殊查询、报告和联机分析处理 (OLAP) 功能,能够对业务数据进行报告、分析和多维建模。Visualization 组件提供图表和图形绘制功能、空间指示板报告服务(比如记分卡报告)、空间分析服务和显示服务,支持与提供用户表示服务的组件进行交互。
Content Management Services 体系结构构建块提供的服务能够以各种格式捕捉、汇总和管理非结构化内容,比如图像、文本文档、网页、电子表格、演示文稿、图形、电子邮件、视频和其他多媒体格式。Content Management Services 能够搜索、编目、保护、管理和存储非结构化内容,并提供工作流服务以支持创建、修订、批准和发布内容。使用 Classification Services 识别新的内容类别并为企业内容创建分类法。Records Management Services 管理业务记录的保存、访问控制和安全性、审计和报告以及最终处置。Storage Management Services 在内容的整个存储生命周期中提供策略驱动的内容移动功能,还支持根据业务内容的总体价值和上下文把内容映射到不同的存储媒体类型。MDM 服务引用 Content Management Services 所管理的内容,通过请求这些服务访问与主数据(比如客户、产品或账户)相关的非结构化内容。例如,应用程序可以通过请求 MDM 服务从 MDM Data Repository 获得产品主数据,然后使用 MDM 系统返回的引用数据请求一个内容管理服务,以获取此产品的图像数据。
MDM Reference Architecture 支持对多个主数据领域采用多种 MDM 使用方法,可???维护跨领域关系,提供为企业维护权威性主数据源所需的功能。这个体系结构具有可伸缩性、高可用性、可扩展性和灵活性,能够与不同厂商提供的技术和以后可能出现的系统集成。
产品映射
在 IT 架构师定义组件模型并为解决方案体系结构开发操作性模型时,要分析需要构建哪些组件,可以购买哪些组件。因此,在操作性建模过程中要映射软件产品。本节介绍 MDM Logical System Architecture 与 IBM 软件产品的关系,帮助 IT 架构师选择软件产品。可以使用推荐的产品实现 MDM Reference Architecture。我们把讨论的范围限制在构建 MDM 解决方案所需的核心领域,反映 Information on Demand 解决方案的典型情况。本文讨论的范围在图 2 中以黄色背景显示:
图 2. 产品映射
下面按照组件简要介绍这些产品的功能。
Analysis and Discovery Services
对于这个组件,只讨论与身份分析相关的服务。对于身份分析服务,可以使用的产品是 IBM Entity Analytic Solutions 和 IBM Global Name Recognition(见 参考资料)。
IBM Entity Analytic Solutions 包含以下功能:
-
身份解析:身份解析解决与身份相关的信息含义模糊和不一致问题,回答 “谁是谁?” 的问题。它判断多个记录中的姓名是同一身份的变体,还是不同的身份。这有助于探测欺骗行为,在国土安全领域帮助确保安全性,满足私密性法律的要求。
-
匿名解析:匿名解析的关键特性是在公司之间共享关于客户、组织、公民或职员的数据,同时保护个人隐私。匿名解析以匿名方式判断 “谁是谁” 和 “谁知道谁”。这使公司能够根据监视对象清单检查身份,或者在发生公司合并时通过比较客户清单判断客户群体的重叠部分 —— 这些过程都采用匿名方式。
-
关系解析:关系解析有助于生成与关系信息相关的团体记录。它揭示客户、厂商、公民或职员之间的关系,帮助回答 “谁知道谁” 的问题,从而发现新的业务机会。另外,还可以提前探测可能有害的关系,在发现可疑的关系时发出警报,从而降低损失和减轻业务风险。
IBM Global Name Recognition 产品提供以下功能:
-
IBM Global Name Analytics:这种技术能够对涉及多种文化的数据集进行灵活的管理。通过使用最先进的姓名识别技术,可以识别出姓名的文化背景。另外,对于主要用于某一性别的名字,还可以判断出性别。
-
IBM Global Name Reference Encyclopedia:这是一个大型数据库,其中包含从世界各地收集的姓名和相关知识。可以以全自动方式根据全球语言学知识处理姓名,这个过程会在特定的文化背景下考虑关于姓名的信息、姓名的含义、典型的拼写变体和性别关联。
-
IBM Global Name Scoring:这种技术提供模糊文本搜索和语音搜索支持,可以更有效地对姓名进行身份检查。它支持多文化姓名搜索,能够消除姓名音译造成的含糊和不一致。
-
IBM Global Name Management:它包含 Global Name Analytics 和 Global Name Scoring 等组件。它以近 10 亿个姓名为基础,支持对来自 200 多个国家的多文化姓名进行解析、判断性别和分类。通过用这种技术衡量姓名之间的相似程度,可以减少虚假数据。
Master Data Management Services
对于这个组件,有两个可用的产品(更多信息参见 参考资料):
- IBM InfoSphere Master Data Management Server
- WebSphere Product Center
IBM InfoSphere MDM Server(见 参考资料)是一种集中地管理不同领域(比如客户、产品、账户和地区)的关键主数据的战略性平台,可以确保主数据的质量。此产品支持多形式 MDM(见 参考资料)。MDM Server 能够在整个企业范围内维护一致、完整且精确的主数据。MDM Server 作为权威性的主数据源,通过多个接口向所有渠道和办公系统提供 “事实” 的单一版本。可以通过接口与现有的系统无缝地集成。MDM Server 提供一个先进的 MDM 解决方案,提供出色的性能和可伸缩性,能够在高事务量环境中支持数百万主数据记录。
可以使用多种实现风格部署 MDM 系统,比如注册、共存和事务实现风格(关于这些风格的更多信息参见 参考资料)。一些软件解决方案采用注册实现风格,只提供主数据的视图;而 MDM Server 支持所有三种实现风格。MDM Server 提供 800 多个开箱即用的业务服务,支持管理和维护主数据所需的各种操作。这可以显著降低处理成本,提高管理主数据的经济有效性。另外,因为 MDM Server 为所有相关的主数据实体提供单一集成点,从而隐藏后端办公系统的复杂性,因此可以显著减少数据仓库 (DW)、客户关系管理 (CRM) 或企业资源规划 (ERP) 的部署成本。这会促进中间件集成,减少维护和升级成本,降低体系结构的复杂性。
通过集中地管理主数据,可以在单一位置跟踪和管理客户隐私。可以在这个中心位置管理合法性,降低成本和提高效率。中心 MDM 系统的其他好处包括:
- 能够在 Business-to-Customer (B2C) 和 Business-to-Business (B2B) 环境中跟踪复杂的层次结构和关系信息
- 在单一位置对主数据实施业务规则和完整性规则,从而节约成本
- 能够实时地防止重复数据,避免昂贵的手工清理,从而降低操作成本
IBM InfoSphere MDM Server 基于开放标准,可以在 SOA 中实现。例如,它提供的基础结构可以帮助公司转移到以客户为中心的业务模型,从而改进客户服务。最后,IBM InfoSphere MDM Server 的价值已经在实践中得到了充分证明,许多行业中的大公司已经部署了这种产品。
WebSphere Product Center 是一个产品信息管理解决方案,它能够把通常分散在企业中的产品、地区和商业伙伴(即供应商和零售商)的相关信息联系起来。在 WebSphere Product Center 中集中地管理这些主数据有以下好处:
- 跨无数的客户、商业伙伴和职员高效地分发产品主数据
- 向网站、电子商务应用程序和印刷解决方案提供丰富的产品信息,帮助推销产品
- 实现与 Global Data Synchronization Network 的单点集成,进一步优化与商业伙???交换产品信息的过程
- 帮助目录经理生成更精确的产品目录报告
- 通过使用产品层次结构中的属性继承等高级特性,降低产品维护成本,提高某些用例的效率,比如 Direct Store Delivery Environment 中的 micro-merchandising
WebSphere Product Center 支持 JMS 等开放标准,这会简化与 SOA 环境中其他系统的集成。为了简化产品信息的导入和导出,还支持 Microsoft® Excel 等多种格式。
对于这两个产品,有许多针对特定行业的解决方案 —— 参见 参考资料 中 MDM Solutions and WebSphere® Product Center industry solutions 页面的链接。
在决定是使用 IBM InfoSphere MDM Sever 还是 WebSphere Product Center 时,应该考虑以下因素:
- 如果解决方案需要跨多个主数据领域应用操作性或分析性使用方法和三种实现风格,那么应该考虑使用 IBM InfoSphere MDM Server。
- 如果解决方案基于协作性使用方法以及签入/签出服务、完整的编写功能和共存实现风格,那么应该考虑使用 WebSphere Product Center。
Information Integration Services
信息集成过程要求能够理解、集成、清理和转换数据和内容,从而向应用程序提供权威、一致、及时且完整的信息,并在整个信息生命周期中支持数据治理。有一个产品套件能够满足对信息集成服务组件的各种需求:它就是 IBM Information Server(在 参考资料 中可以找到更多信息)。IBM Information Server 是一个革命性的信息集成平台,能够在复杂的 IT 环境中无缝地集成信息。另外,现在可以以服务的形式公开传统的信息集成功能(比如地址标准化),并把这些服务组织成过程;例如,在创建客户的业务过程中调用这些服务,在数据进入系统时提高数据质量。这使信息集成功能能够参与 SOA 环境。
IBM Information Server 包含许多组件,见图 3。我们只讨论浅绿色背景的组件,因为它们在实现 MDM 解决方案时非常重要。可以使用其他组件,也可以不使用;例如,只有在应用程序需要与 SAP 和 Siebel 系统集成时,才使用 SAP 和 Siebel 的连接器。但是,这些组件和并行处理引擎是基础结构的一部分。
图 3. IBM Information Server
这些组件是:
-
WebSphere Information Services Director:随着 SOA 的应用日益广泛,越来越多的企业需要高效地把信息集成到业务过程中。这个组件以 “随时可用” 的方式提供信息集成功能,使它们能够参与 SOA 环境。通过以这种方式提供这些服务,就可以在复杂的业务过程(比如创建客户或产品)中以服务形式调用信息集成功能。关键特性包括:
- 通过使用各种绑定,比如用于 Web 服务的 SOAP/HTTP 或用于高速直接 Java 集成的 Enterprise Java™ Bean(EJB),只需几次鼠标单击,即可以服务形式公开功能。
- 它提供一个灵活的基础结构,支持容错、负载平衡和真正的并行执行,能够满足高可用性需求。
- 由于它的设计体系结构利用纯粹的 J2EE 基础结构,它能够向 WebSphere Process Server 和 WebSphere Portal、其他应用程序和数据库提供可靠且灵活的数据集成服务。
- 一个服务目录维护在 MetaData Server 基础结构上构建的所有可用服务。这个服务目录与 WebSphere Service Registry and Repository 集成,能够无缝地把所有服务发布到企业范围的服务存储库中。
- 此组件符合 Web 服务标准以及 W3C 和 Java Community Process 等组织制订的其他开放标准。
-
WebSphere Information Analyzer:在把来自各个数据源的主数据集成到 MDM 系统中之前,需要了解数据的质量和源系统的数据模型。对于这个任务和数据仓库等其他项目中的类似任务,可以使用 ERP 实例整合和 WebSphere Information Analyzer。提前了解数据质量有助于更准确地确定数据集成项目的规模,降低项目风险。关键特性包括:
- 发现数据模型,把发现的数据模型无缝地存储在共享的 MetaData Server 基础结构中,让 WebSphere QualityStage 和 WebSphere DataStage 可以使用它们。
- 价值分布分析。
- 用于发现外键的跨列分析。
- 深入分析功能。
-
WebSphere Business Glossary:创建、管理和共享企业词汇表和词汇分类,这使业务用户和技术用户能够高效地交流。关键特性包括:
- 通过基于 Web 的用户界面管理词汇和类别。词汇组织为层次结构,表示企业中的重要信息概念。
- 操作数据专员常常作为企业数据治理团队的成员,负责管理信息资产。WebSphere Business Glossary 提供先进的管理功能,可以帮助操作数据专员分析数据并支持从外部数据源导入和导出数据。
- WebSphere Business Glossary 可以促进业务用户、数据建模人员、数据分析师和 ETL 开发人员的协作,从而发挥元数据的作用。
- 它支持方便的浏览,不需要培训。
-
WebSphere QualityStage:这个组件提供一个强大的框架,可以开发和部署数据调查、标准化、补充、可能性匹配和挑选操作。例如,可以实现姓名和地址标准化,提高客户主数据的质量。关键特性包括:
- 标准化引擎
- 嵌入的数据词典和规则集
- 与 WAVES 等邮政检验服务无缝集成的接口
- 线性可伸缩性
- 先进的可能性匹配和挑选决策引擎
-
WebSphere DataStage:这个组件是 IBM Information Server 的核心组件之一,提供工业级的提取、转换和装载 (ETL) 引擎。无论源系统、目标系统和时间要求是什么,它都能够集成企业信息。在部署 MDM 解决方案的 Master Data Integration (MDI) 阶段,需要对来自各种 IT 环境的主数据进行整理。WebSphere DataStage 常常很适合把源数据转换为 MDM 系统使用的主数据模型。关键特性包括:
- 它是一个强大的 ETL 解决方案,能够收集、集成和转换大量数据,能够处理复杂的数据结构。
- 它的并行处理引擎帮助它在不断收缩的批处理时间窗中处理快速增长的大量数据。通过在典型的批处理操作中执行转换,提供非常大的数据吞吐量。
- 此组件支持实时数据集成。WebSphere DataStage 使用 JMS 或 WebSphere MQ 适配器从 Message Oriented Middleware (MOM) 队列捕捉消息,从而执行实时操作,按照操作性和历史分析的角度无缝地组合数据。
- 此组件具有功能丰富的连接层,可以从任何数据源(例如 SAP、Siebel、关系数据库和 SAS 等业务智能化系统)提取数据,转换之后再把数据装载到任何目标系统中。
- 此组件提供高级的开发和管理支持。这可以降低新的转换任务的开发成本并简化管理,从而降低操作成本。
-
WebSphere Metadata Server 和 IBM MetaData Workbench:WebSphere MetaData Server 是由管理元数据的所有 IBM Information Server 组件共享的基础结构组件。IBM MetaData Workbench 是一个用于处理元数据的工具。它支持:
- 通过数据衍生关系了解数据的起源。
- 通过影响分析了解在数据模型发生变化时,会影响清理和转换例程中的哪些功能。
- 与设计和操作性元数据无缝地集成,可以查看数据的来源和应用于数据的处理。如果需要满足 Sarbanes-Oxley 或 Basel II 等法律的规定,这就是一项关键功能。

 |

|
结束语
每个 MDM 项目都有独特的困难和风险,在选择软件和实现战略时需要考虑这些因素。MDM Reference Architecture 基于体系结构模式和最佳实践,为企业开发 MDM 解决方案提供一个良好的基础。必须通过选择适当的软件满足技术目标和长期战略性业务目标两方面的需求,这对于实现 MDM 解决方案的当前和长期业务价值非常重要。
在企业开发 MDM 解决方案时,应该参考 MDM Reference Architecture。MDM RA 支持 MDM 解决方案的演进,可以实现一种或多种 MDM 使用方法并适应多个主数据领域。应该通过多个阶段设计体系结构,分别考虑系统分布、非功能性需求(比如性能、灵活性和高可用性)、选择特定的产品、选择中间件和其他技术。设计 MDM Reference Architecture 的主要目标是提供可伸缩性、高可用性、适应性并能够支持高性能。MDM 解决方案的实现总是需要考虑现有的 IT 环境、IT 标准、企业体系结构策略以及用于实现 MDM 系统和 Information Integration Services(比如 Information Integrity、ETL 和 EII)的软件。
在为 MDM 系统选择软件时,一定要考虑长期 MDM 战略。应该设计和实现能够持续地向企业提供业务价值的 MDM 系统,这要求 MDM 系统能够支持多种实现风格。因此,应该使用开放且容易扩展的产品,比如前面的 “产品映射” 一节中介绍的产品,从而确保获得良好的投资回报。
图书预览
Enterprise Master Data Management: An SOA Approach to Managing Core Information 非常详细地讨论与 Master Data Management 相关的问题。这本书的作者是 Allen Dreibelbis、Eberhard Hechler、Ivan Milman、Martin Oberhofer、Paul van Run 和 Dan Wolfson,由 Pearson Publishing 在 2008 年 6 月出版(ISBN-10: 0132366258,ISBN-13: 9780132366250)。这本书讨论 Master Data Management 的许多关键方面,包括 Master Data Management 的业务价值以及如何设计企业 Master Data Management 解决方案。这本书全面介绍 Master Data Management 解决方案的设计,包括参考体系结构、解决方案蓝图、体系结构原则、模式和 MDM 系统的属性。它描述 MDM 和面向服务体系结构之间的关系,以及数据治理对于管理主数据的重要性。其中提供的内容并不专门针对特定的厂商和软件产品,主要关注为 MDM 解决方案设计适当的体系结构所用的原则和方法。对各章内容的详细说明参见 副文件。
|