24、英语问答语句中N - gram的应用研究

英语问答语句中N - gram的应用研究

在问答交流中,不同用户的表达风格差异显著。有的用户倾向于礼貌的表达,而有的则可能语气较为粗鲁;有的喜欢用抽象词汇,有的则更倾向于具体的表述。因此,在研究问答语句时,除了关注文本特征,还需要考虑语句给人的印象。本文旨在通过对语句印象的分析,为提问者推荐合适的回答者,并围绕日语和英语问答语句的印象因素提取、因子得分估计以及不同N - gram的应用展开了一系列研究。

1. 前期研究
1.1 日语语句因素提取

通过印象评价实验来评估问答语句的印象。邀请了41位评估者对语句的风格或内容进行评价,并从50个印象词集合中分配标签。对12组共60条问答语句进行了评估,这些实验材料选自2005年实际发布在Y!C上的语句。通过对实验结果进行因子分析,得到了9个因素,分别命名为准确性、不悦感、创造力、轻松感、坚持性、模糊性、感染力、努力程度和热度。

1.2 日语因子得分估计

仅对作为实验材料的60条语句获得了因子得分。为了能够估计其他语句的因子得分,对其特征值进行了多元回归分析,总共采用了77个特征值。对用于印象评价实验的60条日语问答语句进行多元回归分析,得到的多元相关系数(MCCs)显示,所有9个因素的估计准确性都在0.9以上,表明估计准确性非常好。

1.3 英语因素提取

由于之前的研究特征值主要依赖于日语,因此需要研究该方法在其他语言中的适用性。采用与日语类似的方法,获得了描述英语语句印象的因素。使用了与日语相同的50个印象词,与4位外国受试者合作进行了印象评价实验。实验材料是从Yahoo! Answers(Y!A)实际发布的6组共30条英语问答语句,这些材料从

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值