在学习表格问答的内容时,最常了解就是将数据库模式与输入的问题文本进行结合,但是数据库模式究竟是什么,我也不是十分清楚,在初期,我认为时单纯的表格的列名+表格的内容就是完整的数据库模式。但是不然。
首先,我们需要解释数据库表格的概念,
数据库概念:是 一类数据的集合,每一条数据包含同样属性的属性值,这个属性就是数据表的列名,数据库的形式化定义如下:
T={t,{h1,h2,...,hn}}
其中t表示数据库的一个表,t表示该数据库的表名,hi表示该数据库的第I个列名,n表示表格T一共有n个列名。
在多表单轮问答中,往往存在数据库的表集合,即一个数据库所有表的集合,表的集合定义如下:
S={T1,T2,...Tn}
S代表数据库的表格集合,Ti表示数据库的第i个数据表,n表示该数据库的数据表的数量。
数据库模式图:同属于一个数据库的数据表,其中某些表的列之间存在主外键的连接关系,根据此连接关键构建一个图,这个图就是数据库模式图。数据集模式图的形式化的定义:
G={S, E,w}
其中G表示数据库模式图,S是数据库表集合,也就是图中的节点集合,E表示图中的边集合,其现实意义是表示之间的主外键的连接关系,w表示变得权重值,默认值是1,如下图所示,图中描述一个数据库构建的数据库模式图的形式。