生物物种分离与阿拉伯语元音分析研究
在生物学和语言学领域,分别有关于生物物种分离和阿拉伯语元音分析的重要研究。下面将详细介绍这两方面的研究内容。
一、利用GSOM进行物种分离的平均互信息研究
-
广义GT方程的提出
在研究中,为了让GSOM能分析不同维度的数据集,通过启发式分析发现了原始GT方程的问题。选用了Minkowski距离(其他距离函数的一般形式)对其进行修改。Minkowski距离函数为:
(dist(x) = \left(\sum_{d = 1}^{D} |x_d|^p\right)^{\frac{1}{p}})
若对其乘以和除以(D^{\frac{1}{p}}),可得到:
(dist(x) = D^{\frac{1}{p}} \left(\frac{1}{D} \sum_{d = 1}^{D} |x_d|^p\right)^{\frac{1}{p}} = D^{\frac{1}{p}} AVG)
其中AVG表示数据所有维度上的常数值,对于大的D,不同D的AVG近似相同。由于GT与dist(x)相关,为使GT方程考虑维度,最简单的方法是让GT与dist(x)中与维度相关的部分成比例,即(GT \propto \frac{1}{D^{\frac{1}{p}}})。使用与原始GT方程相同的标准化控制度量SF,广义GT方程变为:
(GT = -\frac{1}{SF} \ln D^{\frac{1}{p}})
这一方程能适应更广泛的距离函数,让GSOM通过单一的SF值分析不同维度的数据集。 -
DNA序列的平均互信