2025五一数学建模竞赛C题思路详解
问题一:用户行为特征分析及新增关注数预测
目标:基于附件1(2024.7.11-7.20历史交互数据),预测各博主在2024.7.21新增关注数,并筛选前5位博主。
核心步骤:
- 数据预处理:
- 清洗异常数据(如时间格式错误、重复记录)。
- 提取关注行为(用户行为=4)并统计每日各博主新增关注数。
- 特征工程:
- 博主侧特征:历史关注数趋势(7天移动平均)、互动类型占比(点赞/评论/观看)、粉丝基数、内容发布频率。
- 用户侧特征:用户活跃度(日均互动次数)、兴趣偏好(对某类博主的互动集中度)。
- 时间特征:周末/工作日效应、近期关注增长率。
- 模型选择:
- 时间序列模型:适用于有明显趋势/周期性的数据(如ARIMA、Prophet)。
- 监督学习模型:随机森林回归、GBDT、LSTM(需时间序列特征)。
- 集成方法