跨系统数据重复的合理性:案例研究
立即解锁
发布时间: 2025-08-22 01:59:12 阅读量: 12 订阅数: 33 


计算机科学讲义6051:编辑委员会与内容概览
### 跨系统数据重复的合理性:案例研究
#### 1. 系统集成工作分析
在系统数据集成过程中,不同系统的集成工作存在差异。下面的表格展示了各系统的集成工作情况:
| 系统 | 集成工作 |
| --- | --- |
| 系统 1 | 数据不一致导致用户通过服务台请求更正 |
| 系统 4 | 文件导出/导入、维护人员之间的沟通、数据检查、手动更正(估计每次 16 小时,每年 5 次) |
| 系统 5 | 工作量隐藏在定期数据整合的大量工作中 |
| 系统 6 | 通过服务台进行国家信息更改 |
| 系统 9 | 通过服务台进行国家信息更改,用户手动更正输出 |
| 系统 11 | 手动维护与其他系统交换数据的翻译表 |
| 系统 12 | 每年报告工作需 4 人月。部分原因是源系统中参考数据(如国家)的差异,创建这些报告需要大量手动工作 |
从表格数据可知,每年在系统间手动集成数据的工作浪费了数人月的工作量。
#### 2. 数据重复的机制识别
若要构建一个无需重复维护数据的系统,首先要确定是否存在可获取数据的源系统,且源系统的数据质量需足以满足目标系统的流程需求。数据的质量属性对集成选项有影响,主要包括:
- **准确性**:数据正确反映外部事实的程度。
- **完整性**:数据反映整个外部事实的程度。
- **及时性**:数据适应外部事实变化的速度。
当找到数据质量合适的源系统后,有以下几种集成数据的选项,各有优缺点,项目需根据利益相关者设定的成功标准进行权衡:
- **手动重新输入数据**:灵活且无需投资,但工作量大,常导致大量输入错误。
- **手动导出和导入文件**:同样灵活,项目投资小,但仍需工作量,且易出错,尤其是在需要手动“改进”数据时。
- **自动交换文件**:投资稍大,仍会出现错误,例如文件不完整。
- **数据库链接到源系统**:投资通常比文件导出/导入小,但灵活性较差,因为源系统更改数据结构可能会破坏目标系统。数据始终是最新的,但目标系统的可用性依赖于源系统和网络。
- **消息传递(如使用 Web 服务)**:投资最大,但比数据库链接更灵活,比文件交换更可靠和灵活。
下面的表格展示了各集成选项的一般优缺点:
| 利益相关者 | 质量属性 | 重要性 | 手动输入 | 手动文件 | 自动文件 | 数据库链接 | 消息传递 |
| --- | --- | --- | --- | --- | --- | --- | --- |
| 项目所有者 | 项目投资(+ 表示较低) | + | ++ | + | -- | - | -- |
| 项目 | 项目风险(+ 表示较低) | + | ++ | + | -- | - | -- |
| 所有者、维护团队 | 独立于其他系统 | + | ++ | + | - | -- | - |
| 所有者、用户 | 业务流程灵活性 | + | ++ | + | -- | -- | - |
| 用户、经理 | 数据集成工作量(+ 表示较低) | ++ | -- | - | + | + | + |
| 用户 | 数据准确性 | ++ | -- | - | + | + | + |
| 用户 | 数据及时性 | ++ | -- | -- | - | + | + |
| 维护团队 | 可维护性 | + | + | - | - | + | ++ |
从表格可以看出,在其他条件相同的情况下,选择手动输入时数据集成工作量最大,选择自动化选项时最小。数据集成工作量通常比初始投资对利益相关者更重要。
#### 3. 案例分析
通过对过去项目中四个系统集成决策的研究,我们可以深入了解数据重复的原因和影响。
- **子案例 1:系统 11 - 国家信息**
- 在系统 11 开发时,架构师积极寻找国家和国籍的合适源系统。文档表明系统 5 和 6 无法提供所需质量的数据,且当时不知道其他系统也存储国家表。因此,系统 11 拥有了自己的国家表。这引出假设 H1:对组织架构环境缺乏了解会增加寻找潜在源系统的成本,从而导致数据重复。
- 当系统 5 和 6 的数据质量不达标时,项目尝试请求系统所有者改进并共享数据,但被拒绝。这引出假设 H2:潜在源系统中数据质量差或未知会导致数据重复;假设 H3:不愿意建立组织依赖关系会导致数据重复。
- **子案例 2:系统 11 - 货币信息**
- 系统 11 需要世界各国可用货币及货币对欧元的即期汇率数据。系统 6 作为财务行政的 ERP 系统,是这些数据的自然源系统,其数据准确可靠,符合假设 H2。
- 系统 11 是基于现代开发平台的新系统,使用消息传递进行组件间通信,这使得“消息传递”和“自动文件传输”选项的项目投资和风险较低。引出假设 H4:集成基础设施的可用性通过降低集成的相对成本,减少数据重复的可能性。
- 系统 11 的开发是一个大型项目,此集成只是其中一小部分,降低了项目投资的重要性。引出假设 H5:项目压力大,会增加项目风险和投资的重要性,从而增加数据重复的可能性。
- 对于系统 11 的业务流程,每天正确接收货币和汇率数据很重要,增加了准确性和
0
0
复制全文