- 博客(6)
- 收藏
- 关注
原创 时间序列
#时间序列#创建数据的深层拷贝data=total_balance浅拷贝data = total_balance.copy()数据重命名data = data[[‘date’,‘purchase_residual’,‘redeem_residual’,‘total_purchase_amt_base’, ‘total_redeem_amt_base’]]for i in data.columns:if i == ‘date’:data[i] = data[i].astype(str)da
2020-08-22 22:38:12
158
原创 决策树分类
基于决策树的分类算法初始化模型分成测试集和训练集模型拟合模型预测模型评估模型评估#选择其类别为0和1的样本 (不包括类别为2的样本)data_target_part = data[data[‘Species’].isin([0,1])][[‘Species’]]data_features_part = data[data[‘Species’].isin([0,1])][[‘Culmen Length (mm)’,‘Culmen Depth (mm)’,‘Flipper Length (m
2020-08-22 21:03:52
218
原创 数据清洗与特征工程
数据清洗与特征工程查找空值处理空值的办法 1.删除空值所在的行 2.用给定的值去填充查找重复值删除重复值对数值型数据 连续数据进行离散化处理文本类型处理#方法三: 使用sklearn.preprocessing的LabelEncoderfrom sklearn.preprocessing import LabelEncoderfor feat in [‘Cabin’, ‘Ticket’]:#for函数lbl = LabelEncoder()label_dict = dict(zip(
2020-08-21 21:25:17
237
原创 逻辑回归
机器学习逻辑回归lr_clf = LogisticRegression() 模型初始化plt.scatter(x_fearures[:,0],x_fearures[:,1], c=y_label, s=50, cmap=‘viridis’)自己对画图库matplotlib.pyplot 和seaborn了解不够,##定义逻辑回归模型clf=LogisticRegression(random_state=0,solver=‘lbfgs’)这里的random_state就是为了保证程序每次运行都分割
2020-08-20 21:05:06
173
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人