推荐算法（一）电影推荐系统

想要好好撸AI

已于 2023-03-17 14:43:55 修改

阅读量1.4w

点赞数 21

CC 4.0 BY-SA版权

分类专栏：推荐算法文章标签：推荐算法算法机器学习

于 2021-12-27 15:06:56 首次发布

本文链接：https://blog.csdn.net/weixin_37699342/article/details/122168648

推荐算法专栏收录该内容

2 篇文章

订阅专栏

这篇博客详细介绍了推荐系统的基本概念，包括基于内容、矩阵分解、item和用户协同过滤的推荐方法，以及冷启动问题和混合算法。此外，还讲解了如何使用TensorFlow构建电影推荐系统，涵盖数据收集、模型构建、训练、评估和完整系统构建的全过程。

一、推荐系统基本概念

1. 基于内容的推荐系统

给定电影部分评分表和电影内容矩阵X，求解用户喜好矩阵theta：

评分记录表：i用户对j电影是否评分了
j用户喜好 * i电影内容 = 预测j用户对i电影的评分
正则化项：通过调整lambda防止theta构成的模型对原始数据集产生过拟合

优点：

不存在商品冷启动
明确告诉用户推荐的商品包含哪些属性

缺点：

需要透彻的内容分析
很少给用户带来惊喜
存在用户冷启动

2. 基于矩阵分解的协同过滤

给定电影部分评分表和用户喜好矩阵theta，求解电影内容矩阵X，再将theta和X相乘，得到完整的电影评分表：

同时求解X和theta，将以上两个公式合并为：

给定电影内容矩阵X，用户喜好矩阵theta，如何给用户A推荐电影？

看用户A看过哪些电影，然后找到电影内容矩阵X找到与之相似的电影，然后推荐给用户A
使用用户喜好矩阵theta找到与用户A相似的其他用户，将其他用户看过的电影推荐给用户A

如何计算两部电影之间的相似度？

每个电影或每个用户可以用向量表示，将每个向量想象成高维空间的一个点，两点之间距离来度量两个实例之间的相似性

优点：

能够根据用户的历史信息推断商品质量
不需要对商品有任何专业领域知识

缺点：

冷启动问题
gray sheep 如果没有其他相似用户，就无法推荐
复杂度会随着商品数量和用户数量的增加而增加
同义词的影响
shilling attack 刷分

3. 基于item的协同过滤

先计算商品之间的相似度：

再预测用户对商品的评分，将其进行排序，选择评分高的商品推荐给用户：

4. 基于用户的协同过滤

先找到与用户A相似的其他用户，看其他用户购买过什么商品：

再预测用户对商品的评分，将其进行排序，选择评分高的商品推荐给用户：

5. 冷启动问题 cold start

针对新用户：

对该用户进行随机推荐，但推荐的东西有可能是反感的
不推荐，用户有行为后再推荐

针对新商品：

在网页中增加一栏代表新电影，当新电影收看人数达到100人，并且被评分，就将该电影的评分信息加入评分表中，然后参与到推荐系统的计算中，最后就可推荐该电影

重要的是解决的问题的方案，然后去实践，测试，优化！

6. 混合算法

组合多种推荐算法：

mixed：使用多个推荐系统同时推荐，将结果推荐给用户
feature combination：将多个推荐系统使用的特征组合起来给另一个推荐系统
cascade：一个推荐系统产生结果后用另一个系统进行筛选，将筛选结果推荐给用户
switching：根据当前状态在不同的推荐系统之间进行切换

7. 推荐系统性能评估

线下评估

RMSE 均方根误差：

MAE 绝对值误差：

Recall 召回率：

针对评分不多的商品
recall = 6/10 = 0.6
recall值越大，推荐系统包含越多用户所需，目标是推荐的商品尽可能是用户所需

Precision：

6/50 = 0.12
与recall结合，当两者分值都很大，系统好

F1 score：

F分值越大越好
如果推荐系统预测用户A会买商品i，实际也如此，是tp，如果实际没有，是fp
如果推荐系统预测用户A不会买商品i，实际也如此，是tn，如果实际买了，是fn

线上评估

并不是线下评估越好，线上也好
而是利润越高越好

CTR：click through rate 用户点击率

推荐系统重复推荐类似商品10次，用户点击3次，CTR = 0.3，越高代表用户感兴趣

CR：conversion rate 转化率

用户点击后，是否看完这部电影或听完这首歌或购买了商品，就是CR，越高代表用户体验好

ROI：不同的投资带来的回报

越大，代表推荐系统性能越好
将回报定义为：利润量增加，阅读量增加
将代价定义为：计算资源成本

QA：成立QA小组，根据个人经验评判推荐系统