机器学习糖尿病例子

#从sklearn.datasets自带的数据中读取糖尿病数据并将其存储在变量diabetes中
from sklearn.datasets import load_diabetes
diabetes=load_diabetes()
#明确特征变量与目标变量
x=diabetes.data
y=diabetes.target
#从sklearn.mode_selection中导入数据分割器
from sklearn.model_selection import train_test_split
#使用数据分割器将样本数据分割为训练数据和测试数据,其中测试数据占比为20%。数据分割是为了获得训练集和测试集。训练集用来训练模型,测试集用来评估模型性能
x_train,x_test,y_train,y_test=train_test_split(x,y,random_state=33,test_size=20%)
#从sklearn.linear_model中选用线性回归模型LinearRegression来学习数据。我们认为糖尿病数据的特征变量与目标变量之间可能存在有某种线性关系,这种线性关系可以用线性回归模型LinearRegression来表达,所以选择该算法来进行学习
from sklearn.linear_model import LinearRegression
#使用默认配置初始化线性回归器
lr=LinearRegression()
#使用训练数据来估计参数,也就是通过训练数据的学习,为线性回归其找到一组合适的参数,从而获得一个带有参数的、具体的线性回归模型
lr.fit(x_train,y_train)
#对测试数据进行预测,利用上述训练数据学习得到带有参数的、具体的线性回归模型对测试数据进行预测,即将测试数据中每一条记录的特征变量(例如年龄、性别、体重指数等)输入该线性回归模型中,得到一个该条记录的预测值
lr_y_predict=lr.predict(x_test)
#模型性能评估。上述模型预测能力究竟如何,可通过比较测试数据的模型预测值与真实值之间的差距来评估,例如使用R-squared来评估
from sklearn.metrics import r2_score
print'r2_score:',r2_score(y_test,lr_y_predict)


>>r2_score:0.49754301479

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值