
sklearn
文章平均质量分 66
yisuoyanyv
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
scikit-learn数据预处理
Python下的机器学习工具scikit-learn(-数据预处理)参考自http://lib.csdn.net/article/machinelearning/1119和http://scikit-learn.org/stable/modules/preprocessing.html(1)数据标准化(Standardization or Mean Removal and Variance Scal原创 2017-07-01 11:52:24 · 635 阅读 · 0 评论 -
sklearn官方文档学习笔记 管道和特征联合(Pipeline and FeatureUnion):组合估计器
sklearn官方文档学习笔记 管道和特征联合:组合估计器Pipeline and FeatureUnion: combining estimators管道:链接估计器from sklearn.pipeline import Pipelinefrom sklearn.svm import SVCfrom sklearn.decomposition import PCAestimators翻译 2017-07-01 16:18:32 · 2847 阅读 · 0 评论 -
sklearn 特征提取
Feature extraction 特征提取参考自官方文档http://scikit-learn.org/stable/modules/feature_extraction.html注意:特征提取与特征选择不同:前者包括将任意数据(如文本或图像)转换为可用于机器学习的数值特征。后者是应用这些特征的机器学习技术。从字典加载特征DictVectorizer类可将表示为标准Python字典(dict)对原创 2017-07-01 20:22:47 · 2466 阅读 · 0 评论 -
Cross-validation 交叉验证与训练集测试集划分
由于代码比较简单,直接看代码生成的结果更容易理解代码的功能和作用,所以没有添加更多的说明。 参考官方文档地址:http://scikit-learn.org/stable/modules/cross_validation.html#cross-validation-evaluating-estimator-performanceimport numpy as npfrom sklearn.mod原创 2017-07-14 18:02:05 · 9171 阅读 · 0 评论 -
机器学习--处理缺失值
处理缺失值在python语言中,缺失值一般被称为nan,是”not a number”的缩写。 下面的代码可以计算出数据总共有多少个缺失值,这里数据是存储在pandas中的DateFrame中:print(data.isnull().sum())处理缺失值有一下几种方式:1.删除包含缺失值的数据列data_without_missing_values=origin...原创 2018-05-08 21:57:30 · 2287 阅读 · 1 评论 -
机器学习笔记-房价预测实例
机器学习笔记摘自kaggle初学者教程 所用数据集为一个房价预测的数据集import pandas as pdmain_file_path = 'dataset/kaggle_house_prices/train.csv'data = pd.read_csv(main_file_path)#删除数据集中的缺失值# data=data.dropna(axis=0)#显示数据...原创 2018-05-08 11:49:09 · 3856 阅读 · 0 评论