基于文本挖掘的上下文感知推荐方法与体育服务可操作知识提取
立即解锁
发布时间: 2025-08-30 01:37:21 阅读量: 9 订阅数: 17 AIGC 

### 基于文本挖掘的上下文感知推荐方法与体育服务可操作知识提取
在当今的信息时代,推荐系统和体育服务管理面临着诸多挑战。一方面,推荐系统需要更精准地考虑上下文信息以提供高质量的推荐;另一方面,体育服务提供商需要有效降低客户流失率,提高客户忠诚度。本文将介绍一种基于文本挖掘的上下文感知推荐方法,以及如何在体育服务中提取可操作知识以增加业务效用。
#### 基于文本挖掘的上下文感知推荐方法
##### 评估概述
为了评估该推荐方法,进行了两项不同的评估。
1. **第一项评估**:将CARM - TM方法(结合CIET.5 embed和RulesContext技术)与无上下文的MF算法(基线)进行比较,以展示CIET.5 embed和RulesContext技术提取的上下文信息在上下文CAMF推荐系统中的影响。
2. **第二项评估**:使用CARM - TM方法比较CIET.5 embed和RulesContext,以确定哪种上下文提取技术能提供最佳推荐。
##### 数据集
使用的数据集是RecSys数据集,来自2013年ACM RecSysChallenge,用于为Yelp用户定制推荐。该数据集包含11,537个项目(商家)、45,980个用户和229,901条评论。用户可以在Yelp网站上通过评论对商家进行评价,包括星级评分(1 - 5星)和文字评论。
##### 实验设置
1. **评估指标**:为了衡量推荐系统的预测能力,使用All But One协议和10折交叉验证。将文档集划分为10个子集,每次使用n - 1个子集进行训练,剩余子集进行测试。训练集用于构建推荐模型,对于测试集中的每个用户,隐藏一个项目作为单例集H,其余项目作为推荐中使用的可观察项目集O。基于10折交叉验证,计算10个推荐的平均精度均值(MAP@10),并使用双侧配对t检验(置信水平95%)比较两个推荐算法。
2. **CIET.5 embed技术**:考虑阈值值为0.25、0.50和1.0,上下文大小为4和10个单词,共使用6种不同配置(3个阈值值×2个上下文大小)。这些值是根据先前工作的最佳结果采用的。
3. **RulesContext技术**:使用最小支持值为10%和置信值为50%生成关联规则。为了选择最相关的规则,使用MI度量的切割百分比为50%和75%。从最相关的规则中,选择前5、10和20条规则的集合,共6种组合(2个MI值×3个集合大小)。
4. **算法执行**:MF和CAMF算法执行20次,k值为5、10、50和100,λ值为1、10、100、150和200。
##### 实验结果
1. **CIET.5 embed技术结果**:与基线MF相比,总体结果非常令人满意。上下文信息10 1提供了最佳结果,但在k = 5和λ = 150的参数下,上下文10 025呈现了最佳的MAP@10值。
| Parameters | Baseline | 4 025 | 4 05 | 4 1 | 10 025 | 10 05 | 10 1 |
| --- | --- | --- | --- | --- | --- | --- | --- |
| λ = 1, k = 5 | 0.001479 | 0.001436 | 0.001535 | 0.000929 | 0.001503 | 0.001929 | 0.002839 |
| λ = 1, k = 10 | 0.001176 | 0.001400 | 0.001569 | 0.001431 | 0.001262 | 0.000925 | 0.003606∗ |
| … | … | … | … | … | … | … | … |
2. **RulesContext技术结果**:结果同样令人满意。在大多数情况下,MI切割为50%提取的上下文呈现了最佳结果,其中上下文50 20提供了最高的MAP值。
| Parameters | Baseline | 50 5 | 50 10 | 50 20 | 75 5 | 75 10 | 75 20 |
| --- | --- | --- | --- | --- | --- | --- | --- |
| λ = 1, k = 5 | 0.001479 | 0.001641 | 0.002433 | 0.002041 | 0.001886 | 0.002178 | 0.001942 |
| λ = 1, k = 10 | 0.001176 | 0
0
0
复制全文
相关推荐









