社区云

sklearn

lestatlu 来自 2048 AI社区

2048ai.net · 11小时前

遥感&机器学习入门实战教程｜Sklearn案例⑭：数据划分与交叉验证（KSC 真实数据）

本文探讨了遥感影像分类实验中数据集划分的重要性，指出传统train_test_split方法的不足，并介绍了更科学的交叉验证方法。文章通过KSC高光谱数据案例，详细展示了单次分层划分、KFold交叉验证、StratifiedKFold分层交叉验证以及Pipeline的实践应用，强调交叉验证能提供更稳定可靠的模型评估结果。作者建议在样本量有限或类别不均衡时，应采用分层K折交叉验证结合Pipeline

#机器学习 #sklearn #人工智能 +1

565 

18 
正义的彬彬侠来自天启AI社区

tianqi.csdn.net · 2025-03-20 09:53:51

【scikit-learn】sklearn.svm.SVC 类：支持向量机分类器

SVC（Support Vecto rClassification）是sklearn.svm提供的支持向量机（SVM）分类模型，适用于二分类和多分类任务，尤其擅长小规模数据、非线性分类问题。SVC适用于分类任务，支持核方法进行线性和非线性分类，适用于小规模数据，比RandomForestClassifier更适合高维小数据，可以调整C和gamma控制模型复杂度。

#支持向量机 #sklearn #scikit-learn +1

936 

9 
abc123susie 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-04-19 07:42:52

机器学习系列(5)_特征工程02特征提取

文章目录#数据预处理，特征选择的目的是改善数据质量，体现数据的本质特征，降低计算成本，提升模型的表现。特征选择–主要分为三个模块：特征提取（Features Extraction）：如从文本型数据提取日期型数据；从非结构化数据（文本，视频，音频等）提取数据。如：Web爬取等；特征创建（Features Creation）：通过组合，计算等方法，得到原本不存在的特征（必须是合理的）；特征选择（Fea

#机器学习 #sklearn

1559 

3 
Grateful_Dead424 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-12-01 20:23:25

贝叶斯分类器做文本分类案例

贝叶斯分类器做文本分类文本分类是现代机器学习应用中的一大模块，更是自然语言处理的基础之一。我们可以通过将文字数据处理成数字数据，然后使用贝叶斯来帮助我们判断一段话，或者一篇文章中的主题分类，感情倾向，甚至文章体裁。现在，绝大多数社交媒体数据的自动化采集，都是依靠首先将文本编码成数字，然后按分类结果采集需要的信息。虽然现在自然语言处理领域大部分由深度学习所控制，贝叶斯分类器依然是文本分类中的一颗明珠

#机器学习 #sklearn

3168 

1 
21岁害怕编程来自讯飞AI开发者社区

xfyun.csdn.net · 2022-02-26 17:38:51

运用sklearn的pipeline机器学习实战（以墨尔本房价为例）

我们在运用pandas写机器学习的数据预处理时，数据清洗和建模部分有时候会觉得写的比较乱，维护和修改较为麻烦。不过，sklearn库中的Pipeline（流水线）较好地解决了这个问题，

#sklearn #pandas

1407 

1 
404detective 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-08-17 10:19:36

机器学习 sklearn 无监督学习聚类算法 K-means

import matplotlib.pyplot as pltfrom sklearn.datasets.samples_generator import make_blobsfrom sklearn.cluster import KMeans# 生成测试数据# X为样本特征，Y为样本簇类别，共1000个样本，每个样本2个特征，对应x和y轴，共4个簇，# 簇中心在[-1,-1], [0,0],[1

#机器学习 #python #sklearn +1

996 

4 
爱做梦真是太好了来自讯飞AI开发者社区

xfyun.csdn.net · 2020-03-26 10:30:51

sklearn的模型训练与预测

目录sklearn的模型训练与预测分类任务流程三步走xgboost算法分类随机森林算法分类sklearn的模型训练与预测sklearn是强大的python机器学习工具，支持丰富的机器学习算法和数据预处理，在学术界和企业中应用广泛，下面是sklearn的代码编写流程和各种算法使用示例（以分类为例）。分类任务流程三步走创建模型对象训练预测与性能评价xgboost算法分类'''*...

#sklearn #随机森林 #机器学习

3942 

2 
深度之眼来自天启AI社区

tianqi.csdn.net · 2021-09-26 19:02:45

一文掌握机器学习中的三种特征选择方法

机器学习中的一个经典理论是：数据和特征决定了机器学习的上限，而模型和算法只是逼近这个上限。也正因如此，特征工程在机器学习流程中占有着重要地位。广义的特征工程一般可分为三个环节：特征提取、特征选择、特征衍生，三个环节并无明确的先手顺序之分。本文主要介绍三种常用的特征选择方法。特征选择是指从众多可用的特征中选择一个子集的过程，其目的和预期效果一般有如下三方面考虑：改善模型效果，主要是通过过滤无效特征或

#sklearn #机器学习 #python

958 

1 
我有辣条你跟不跟我走_ 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-10-21 17:36:57

机器学习-中文文本特征抽取

对字符串列表 data = ['发表回复这件事', '飞机里面飞一杯飞机专属奶茶', '没有什么比在飞机上喝一杯飞机专属的飞机奶茶要更好了'] 进行中文文本特征抽取import sklearn.feature_extraction.text as textimport jiebatransfer = text.CountVectorizer(stop_words=['vb'])def count_

#机器学习 #python #sklearn

264 

1 
Alive Ιеι 来自讯飞AI开发者社区

xfyun.csdn.net · 2019-11-20 15:55:33

神经网络进行股票预测

-- coding: utf-8 --“”"@Time : 19-10-1 上午7:32@Author : lei@Site :@File : 神经网络预测股票.py@Software: PyCharm“”"股票预测import pandas as pdimport numpy as npfrom sklearn.model_selection import train_te...

#神经网络 #sklearn

2506 

1 
西猫雷婶来自长沙城市开发者社区

devpress.csdn.net/changsha · 2025-08-24 10:14:30

神经网络|(十四)概率论基础知识-协方差和方差

本文介绍了协方差与方差的核心概念及其关系。协方差用于衡量两个随机变量的线性相关性（正相关、负相关或不相关），其计算基于变量偏离均值的乘积期望。方差则是协方差的特例，表示变量与自身的协方差，反映数据离散程度。通过公式推导展示了二者间的联系：当计算变量与自身的协方差时，结果即为方差。文章系统梳理了这些统计量在描述变量关系时的数学本质和实际意义。

#神经网络 #概率论 #人工智能 +4

898 

21 
疯狂的小强呀来自讯飞AI开发者社区

xfyun.csdn.net · 2023-03-18 09:58:59

机器学习框架sklearn之朴素贝叶斯算法

假设特征和特征之间是相互独立的：通常，事件 A 在事件 B 发生的条件下与事件 B 在事件 A 发生的条件下，它们两者的概率并不相同，但是它们两者之间存在一定的相关性，并具有以下公式（称之为“贝叶斯公式”）：朴素+贝叶斯公式应用场景：文本分类（单词作为特征）

#机器学习 #sklearn #python

689 
_睿智_ 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-09-10 22:22:00

机器学习（实战）泰坦尼克号（游客存活率预估）

目录一、读取数据二、设置特征值和目标值三、数据处理1、缺失值处理2、特征值转换为字典四、划分数据集五、特征工程（特征值提取）六、获取决策树预估器，训练七、模型评估方法一：比对方法二：计算得分总代码一、读取数据资源下载链接1（推荐）：https://download.csdn.net/download/great_yzl/22363793资源下载链接2（不推荐）：https://pan.baidu.

#机器学习 #人工智能 #sklearn +1

840 

1 
小白_马来自讯飞AI开发者社区

xfyun.csdn.net · 2021-08-25 21:34:44

机器学习--分类算法入门Knn kmeans 朴素贝叶斯决策树

Kmeans:K-means算法，也称为K-平均或者K-均值，一般作为掌握聚类算法的第一个算法。如上图以 K 为2，样本集为M 来描述KMean算法，算法执行步骤如下：（1）随机选取K个点做为初始聚集的簇心（也可选择非样本点）;（2）分别计算每个样本点到 K个簇核心的距离（这里的距离一般取欧氏距离或余弦距离），找到离该点最近的簇核心，将它归属到对应的簇；（3）所有点都归属到簇之后， M个点就分为了

#算法 #机器学习 #sklearn

1107 

1 
Grateful_Dead424 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-09-27 22:11:18

机器学习Sklearn实战——KNN算法

scikit-learnSimple and efficient tools for predictive data analysisAccessible to everybody, and reusable in various contextsBuilt on NumPy, SciPy, and matplotlibOpen source, commercially usable - BSD

#sklearn #机器学习 #python

720 

1 
matrix_studio 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-10-28 09:02:40

从sklearn学机器学习（专栏简介）

本专栏將立足于sklearn的官方文档，依次对机器学习领域的模型、划分数据集的方法、评估指标等一系列的内容展开讲解。对于有机器学习理论的同学来说，本专栏涉及到的知识广泛、全面且深刻，可以作为理论学习上的一次重要的回顾；对于将要涉及应用实践的同学来说，本专栏易于理解，容易上手，是难得的入门途径。希望本专栏能获得大家的喜爱。...

#机器学习 #sklearn #python

350 

2 
Michael_Flemming 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-08-08 13:36:19

机器学习交叉验证 sklearn

机器学习模型评估--数据集划分方法交叉验证

#机器学习 #sklearn #python

1247 
发现你走远了来自讯飞AI开发者社区

xfyun.csdn.net · 2022-09-20 12:04:24

【机器学习】02. 使用sklearn库牛顿化、正则化的逻辑回归（代码简洁，思路推导）

【机器学习】02. 使用sklearn库牛顿化、正则化的逻辑回归（代码简洁，思路推导）

#机器学习 #逻辑回归 #python +1

1261 

3 
Coder_preston 来自讯飞AI开发者社区

xfyun.csdn.net · 2023-01-01 16:27:53

【机器学习】TF-IDF词袋模型简介

本文介绍了TF-IDF的基本概念，然后介绍了sklearn 中的具体使用方法，数据的输入输出以及降维处理。了解了这些，基本就可以在实际的业务场景中灵活使用TF-IDF特征进行机器学习训练了。

#sklearn

1715 

3 
Henrik698 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-02-18 18:56:56

机器学习-Sklearn-01（决策树）

机器学习-Sklearn-01（决策树）

#机器学习 #sklearn #决策树

1766 
qq_28479619 来自讯飞AI开发者社区

xfyun.csdn.net · 2023-11-17 11:03:35

python sklearn实现机器学习分类算法

K-Nearest Neighbors (KNN) 是一种基本的分类和回归方法。在分类任务中，KNN 根据输入特征的 k 个最近邻居的类别来预测输入的类别。而在回归任务中，KNN 则根据输入特征的 k 个最近邻居的实数值来预测输入的实数值。在训练过程中，KNN 并不需要明确的训练阶段和预测阶段的划分，而是在输入数据时进行即时预测。KNN 具有简单、直观和易于实现的特点，并且在一些简单的分类和回归问

#python #机器学习 #sklearn

420 
Sol-itude 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-06-15 21:01:43

关于Scikit-learn机器学习的笔记——第四篇

对数据进行Normalization，并且以SVM模型为例，展现了数据标准化前后的差别

#机器学习 #scikit-learn #sklearn

190 

1 
CHRN晨来自讯飞AI开发者社区

xfyun.csdn.net · 2021-12-04 17:29:32

【机器学习】数据预处理类型总结

数据预处理总结基于sklearn包1、标准化：去均值和方差按比例缩放(scale,StandardScaler)1.1将特征缩放至特定范围内(MinMaxScaler,MaxAbsScaler)1.2缩放稀疏矩阵数据2.归一化(Normalizer)3.类别特征编码(OneHotEncoder)4.离散化4.1K-bins离散化(KBinsDiscretizer )4.2特征二值化(Binariz

#机器学习 #sklearn #python +1

1421 

1 
B&LUE 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-08-15 18:09:00

机器学习之决策树——信息熵、信息增益、信息增益率、基尼指数、决策树的基本实现、Sklearn实现决策树及参数详解、绘制决策树

信息熵、信息增益、信息增益率、基尼指数的实现，决策树基本代码、绘制决策树的实现，基于Sklearn实现决策树并使用红酒数据进行实战。

#机器学习 #决策树 #sklearn

1530 

3 
Judy~judy 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-08-08 01:08:06

机器学习------Sklearn之决策树

sklearn中决策树的具体实现

#机器学习 #sklearn #python

857 
belldeep 来自讯飞AI开发者社区

xfyun.csdn.net · 2021-10-30 12:12:14

python：机器学习网站

机器学习官方网站 scikit-learn.org机器学习中文网站 scikit-learn.org.cnSciPy 是一个开源的 Python 科学计算库，其中涵盖了科学计算中的各种工具，包括统计、积分、插值、最优化，图像处理等等。SciPy 可以与 NumPy 合作，高效地进行矩阵计算。而各种不同领域的开发者们，在 SciPy 的基础上发展出许多分支版本，统一称为 Scikits，即 Sc

#python #机器学习 #sklearn

983 
落魄陈平安来自讯飞AI开发者社区

xfyun.csdn.net · 2024-07-07 11:09:54

机器学习代码——决策树

案例测试。

#机器学习 #决策树 #人工智能 +3

280 

5 
疯狂的小强呀来自讯飞AI开发者社区

xfyun.csdn.net · 2023-02-10 16:02:23

机器学习框架sklearn之特征预处理:无量钢化

通过一些转换函数将特征数据转换成更加适合算法模型的特征数据过程。数字型数据的无量钢化：①归一化②标准化为什么要进行归一化/标准化？特征的单位或者大小相差较大，或者某特征的方差相比其他特征要大出几个数量级，容易影响（支配）目标结果，使得一些算法无法学习到其他的特征。我们需要用到一些方法进行无量钢化，使不同规格的数据转换到同一规格。

#sklearn #python

542 
繁星① 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-11-14 10:48:43

机器学习-基础知识、sklearn库、评估指标、python数据处理库

内容涉及基础知识、sklearn库、评估指标、python数据处理库

#python #sklearn

2463 

8 
Sol-itude 来自讯飞AI开发者社区

xfyun.csdn.net · 2022-06-13 14:43:19

关于Scikit-learn机器学习的笔记——第一篇

关于Sklearn的机器学习笔记第一篇，以鸢尾花作为例子进行了学习测试

#机器学习 #scikit-learn #sklearn

294 

2 
鹿衔草啊来自讯飞AI开发者社区

xfyun.csdn.net · 2022-03-17 16:52:32

机器学习-sklearn第十二天——笔记

目录线性回归1 概述1.1 线性回归大家族1.2 sklearn中的线性回归2 多元线性回归LinearRegression2.1 多元线性回归的基本原理2.2 最小二乘法求解多元线性回归的参数2.3 linear_model.LinearRegression class3 回归类的模型评估指标3.1 是否预测了正确的数值3.2 是否拟合了足够的信息4 多重共线性：岭回归与Lasso4.1 最熟悉

#机器学习 #sklearn #人工智能

1602 
Lucky_Go 来自讯飞AI开发者社区

xfyun.csdn.net · 2019-10-12 13:14:28

[机器学习] 决策树

决策树的基本概念决策树是一类常用的机器学习方法，决策树实现决策的过程和我们平时做决定的过程很相似。想想如果自己马上要放假，要不要出去浪就是个大问题，首先考虑老板交代的接近deadline的项目有没有完成，如果完成了就可以放心大胆的浪了，否则就乖乖磕研吧；任务完成了，但是转念一想，最近剁手太多没钱，算了还是宅着省钱吧；突然发现发工资了，有钱浪了，赶紧看看天气预报，如果假期天气不错果断室外放飞自.

#sklearn

603 
想要上岸的小李来自上海城市开发者社区

devpress.csdn.net/shanghai · 2023-05-08 21:44:26

使用sk-learn库实现k-means算法对iris数据分类

使用sk-learn库实现k-means算法对iris数据分类

#kmeans #算法 #机器学习 +2

4513 

6 
TranSad 来自上海城市开发者社区

devpress.csdn.net/shanghai · 2022-05-30 21:20:49

PCA降维原理操作步骤与优缺点

PCA全称是Principal Component Analysis，即主成分分析。它主要是以“提取出特征的主要成分”这一方式来实现降维的。介绍PCA的大体思想，先抛开一些原理公式，如上图所示，原来是三维的数据，通过分析找出两个主成分PC1和PC2，那么直接在这两个主成分的方向上就可以形成一个平面，这样就可以把我们三位的样本点投射到这一个平面上（如右图）。那么此时的PC1和PC2都不单单是我们的其

#sklearn #机器学习 #python +2

3.2w 

71 
AI小龘来自上海城市开发者社区

devpress.csdn.net/shanghai · 2021-10-22 23:05:50

(Python sklearn+KMeans)聚类实现鸢尾花分类

#导入所需模块import matplotlib.pyplot as pltimport numpy as npfrom sklearn.cluster import KMeansfrom sklearn.datasets import load_iris#导入鸢尾花数据集iris = load_iris()X = iris.data[:]# print(X)print(X.shape)#肘方法看

#聚类 #python #sklearn +1

4646 

7 
旅途中的宽~ 来自上海城市开发者社区

devpress.csdn.net/shanghai · 2023-02-20 08:49:11

【Python】sklearn 中的 make_blobs() 函数详解

【Python】sklearn 中的 make_blobs() 函数详解

#python #sklearn #聚类

5304 

13 

标签介绍

sklearn

——sklearn

热门标签

关于我们

联系我们（工作时间：8:30-22:00）

400-660-0108 [email protected]