组合语义的表示学习
立即解锁
发布时间: 2025-09-04 00:48:55 阅读量: 15 订阅数: 12 AIGC 

### 组合语义的表示学习
#### 1. 二元组合概述
组合语义学的目标是通过二元组合,用基本单元构建更高级语言单元的向量表示。通常假设短语的每个组成部分都能嵌入到一个可计算的向量中,用于生成该短语的表示向量。
在二元组合中,每次操作涉及两个对象。例如,对于由“machine”和“learning”组成的短语“machine learning”,已知表示这两个词的向量 $\mathbf{u}$ 和 $\mathbf{v}$,我们的主要目标是根据这两个词的表示构建短语的表示向量 $\mathbf{p}$。假设在一个简单的语义空间中,每个向量由五个整数表示,“machine”和“learning”的假设向量分别为 $[0, 3, 1, 5, 2]$ 和 $[1, 4, 2, 2, 0]$。若直接使用加法运算符表示“machine learning”,则为 $[0, 3, 1, 5, 2] + [1, 4, 2, 2, 0] = [1, 7, 3, 7, 2]$。解决这个问题的关键在于设计一个作为二元运算符的原始组合函数,基于此函数可递归应用于词序列,以推导更长文本的组合。
建模二元组合函数是一个研究充分但仍具挑战性的问题,主要有加法模型和乘法模型两种视角,下面分别介绍。
#### 2. 加法模型
加法模型以加法为基本操作。为简化讨论,将公式简化为 $\mathbf{p} = f(\mathbf{u}, \mathbf{v})$,省略关系和背景项。显然,若要正确执行加法,$\mathbf{p}$、$\mathbf{u}$ 和 $\mathbf{v}$ 应处于同一语义空间。
- **简单求和表示**:最简单的方法是直接使用求和来表示联合表示,即 $\mathbf{p} = \mathbf{u} + \mathbf{v}$。例如,“machine”和“learning”对应向量求和为 $\mathbf{w}(\text{machine}) + \mathbf{w}(\text{learning}) = [1, 7, 3, 7, 2]$。此方法假设不同组成部分的组合是对称函数,不考虑组成部分的顺序,存在诸多缺点,如缺乏对词序的建模能力以及背景句法或知识信息,但仍提供了一个相对较强的基线。
- **加权求和改进**:为克服词序问题,可采用加权求和,形式为 $\mathbf{p} = \alpha\mathbf{u} + \beta\mathbf{v}$,其中 $\alpha$ 和 $\beta$ 是两个向量的不同权重。当 $\alpha \neq \beta$ 时,$(\mathbf{u}, \mathbf{v})$ 和 $(\mathbf{v}, \mathbf{u})$ 有不同表示,符合真实语言现象。例如,设 $\alpha = 0.3$,$\beta = 0.7$,则 $0.3\times\mathbf{w}(\text{machine}) = [0, 0.9, 0.3, 1.5, 0.6]$,$0.7\times\mathbf{w}(\text{learning}) = [0.7, 2.8, 1.4, 1.4, 0]$,“machine learning”的表示为它们的和 $[0.7, 3.7, 1.7, 2.9, 0.6]$。
- **结合邻域语义**:可将先验知识和句法信息纳入加法模型,结合 $K$ 近邻语义进行组合,公式为 $\mathbf{p} = \mathbf{u} + \sum_{i=1}^{L} \mathbf{m}_i + \mathbf{v} + \sum_{i=1}^{K} \mathbf{n}_i$,其中 $\mathbf{m}_1, \mathbf{m}_2, \ldots, \mathbf{m}_L$ 是 $\mathbf{u}$ 的语义邻居(同义词),$\mathbf{n}_1, \mathbf{n}_2, \ldots, \mathbf{n}_K$ 是 $\mathbf{v}$ 的语义邻居。这种方法将同义词作为平滑因子纳入组合函数,降低语言的方差。例如,在“machine”和“learning”的组合中,选择“computer”和“optimizing”作为邻居,其向量分别为 $[1, 0, 0, 0, 1]$ 和 $[1, 5, 3, 2, 1]$,则“machine learning”的表示变为 $\mathbf{w}(\text{machine}) + \mathbf{w}(\text{computer}) + \mathbf{w}(\text{learning}) + \mathbf{w}(\text{optimizing}) = [3, 12, 6, 9, 4]$。
- **相似度计算**:在语义空间中,余弦函数是衡量表示之间相似度的自然方法。计算 $\
0
0
复制全文
相关推荐










