数据入口:在线书店A/B测试数据集 - Heywhale.com
数据说明
字段 | 说明 |
---|---|
Theme | 显示主题,dark(深色);light(浅色) |
Click Through Rate | 点击率:用户点击网站上链接或按钮的比例 |
Conversion Rate | 转化率:首次访问后在平台上注册的用户百分比 |
Bounce Rate | 弹出率:访问单个页面后没有进一步互动就离开的用户百分比 |
Scroll Depth | 滚动深度:用户滚动浏览网页页面的深度 |
Age | 用户年龄 |
Location | 用户位置 |
Session Duration | 用户在网站上的会话持续时间 |
Purchases | 用户是否购买了书籍(是/否) |
Added_to_Cart | 用户是否将书籍添加到购物车(是/否) |
一家在线书店正在优化其网站设计,为用户提供了两种主题:浅色主题和深色主题。本数据集包含了使用不同主题的用户交互、参与度等相关数据。可以通过进一步的数据分析确定哪个主题能带来更好的用户参与度和更高的图书购买转化率,以及通过构建机器学习模型来预测用户是否购买了书籍。
一:主题因素分析
import pandas as pd
data = pd.read_csv("website_ab_test.csv")
theme_counts = data['Theme'].value_counts()
theme_counts
在Theme列中,Light Theme有514行,Dark Theme有486行。
statistics = ['Click Through Rate', 'Conversion Rate', 'Bounce Rate', 'Scroll_Depth', 'Session_Duration']
theme_stats = data.groupby('Theme')[statistics].agg(['mean', 'std'])
theme_stats
对于“Click Through Rate”、“Conversion Rate”、“Bounce Rate”、“