TREAT:环境数据库逆向工程方法与工具
立即解锁
发布时间: 2025-08-23 00:12:08 阅读量: 9 订阅数: 28 


数据库与专家系统的应用进展
### TREAT:环境数据库逆向工程方法与工具
#### 1. 数据建模的重要性与挑战
在林业数据管理中,数据建模和管理至关重要。Boehm的研究表明,非原作者将需求融入非结构化系统时,所需的开发工作量通常是系统初始实施时的40倍。这意味着大量高成本收集和生成的数据可能会丢失或无法被其他研究有效利用。
以印度尼西亚森林部门的项目为例,该项目由欧盟委员会资助,旨在加强省级林业部门的森林规划和管理能力。为此,进行了植物、动物和土壤调查,并将社会经济、气候、地质、地形等数据整合到综合且用户友好的综合森林资源信息系统(IFRIS)中,以补充国家森林清单。
#### 2. 信息系统类型及数据建模方法
IFRIS涉及多种信息系统,主要关注运营事务处理(TP)和决策支持系统(DSS)。TP系统处理日常标准操作,如输入、修改和报告“运营”数据,具有原子性、一致性、隔离性和持久性等传统ACID特性。DSS则支持“知识工作者”对“信息”数据进行战略探索,常以“如果……会怎样?”的查询形式出现。管理信息系统(MIS)对于持续的森林管理、保护或寻求ISO14000认证的机构也至关重要,是IFRIS的重要组成部分。
构建TP、MIS和DSS信息系统的标准方法是通过一系列可逐步转换和细化的模型,弥合问题域与解决方案空间之间的语义差距。标准模型包括概念模型、逻辑模型和物理模型,通过对每个细化步骤进行验证和确认来保证质量。
每个信息模型可从数据和处理这些数据的过程角度来看,主要由以下三个组件组成:
1. **结构**:包括对象、属性以及对象之间的关联。
2. **操作**:用于操作结构。
3. **领域知识和约束**:确保(静态)数据库状态以及操作和状态转换的有效性。
虽然实体 - 关系(ER)建模已成功应用于图形、空间和时间实体的数据建模,但面向对象(OO)在分析和设计采用事件驱动与多媒体对象交互的系统表示层(如基于GIS的用户界面)方面具有明显优势。不过,考虑到印度尼西亚当地技能有限,基于ER模型的结构化数据分析对于TP和DSS系统的数据管理和存储层是足够的。
#### 3. 实际模型提取经验
以印度尼西亚对电子表格中植物数据的分析为例,电子表格是流行且灵活的数据操作工具,但缺乏数据字典或其他显式机制来存储元数据,也没有输入或状态转换验证功能。其隐式元数据仅限于单元格值的数据类型信息和嵌入式公式的范围关系。
植物数据由多组Microsoft Excel工作簿组成,每个工作簿代表一个研究区域,包含两个相关的工作表,分别是树木数据和样地数据。没有特定领域知识和“适当”的文档,很难理解这些数据的含义。从电子表格数据生成数据模型的实际过程需要多次查看文件、阅读可用文档和报告,并与领域专家进行交互。
#### 4. 逆向工程工具TREAT的设计
软件工程界在从代码自动逆向工程过程模型和重新设计系统方面做了很多工作,但数据模型的逆向工程研究相对较少。Chikofsky和Cross将逆向工程定义为“分析系统以识别组件及其相互关系,以便以另一种形式(通常是更高层次的抽象)创建表示的过程”,重新设计则是“通过逆向工程恢复设计后,可能在不同环境中重新实现系统的过程”。
由于信息不完整和元数据未记录,完全自动化逆向工程森林植物数据是不可行的。因此,开发了TREAT工具,其目标是:
1. 尽可能自动化。
2. 通过转换验证确保质量。
3. 在无法自动化的过程中,通过修剪搜索空间和呈现相关信息来协助分析师/领域专家。
TREAT工具的交互步骤如下:
1. **初始化符号表和数据字典**:设置并初始化电子表格对象的符号表和数据字典,符号表列出每个工作簿、工作表、数据集的范围、数据类型和名称,通过迭代提示用户选择标题和数据范围来实现。数据字典用一个虚拟的“超级实体”初始化,每个工作簿和工作表都表示为一个临时实体,并分配一个临时唯一名称。
2. **处理符号表**:将每个列条目作为包含它的工作表实体的属性,并将列引用、名称和数据类型输入数据字典。每行是一条记录,每个单元
0
0
复制全文
相关推荐










