用飞桨实现年收入预测

最新推荐文章于 2024-05-17 16:35:26 发布

原创

最新推荐文章于 2024-05-17 16:35:26 发布 · 411 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习

上回的话，我做第一次的时候因为后来没时间了，就放弃了，这回的话我就算是过了提交时间我也要把它复现出来。

开始：

数据处理

先是导库：

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

然后先把数据集读取一下：

data_x = pd.read_csv("work/data/X_train")
print(data_x)

data_y = pd.read_csv("work/data/Y_train")
print(data_y)

然后下面的操作先看操作效果：

.values的话就是以array形式返回指定column的所有取值，然后接下来我们可以用numpy进行操作,然后我们再获得行数，然后将y也转一下

X_data = df_dataset_X.iloc[:, 1:].values
m_dataset = X_data.shape[0]
y_data = df_dataset_y.iloc[:, 1].values.reshape(m_dataset, 1)
dataset = np.concatenate((x_data, y_data), axis=1)

然后计算一下，但是为啥要这么做呢？这么做的目的是什么呢？我知道就是转numpy可能会好操作。首先我们看一下就是y的数据是0和1，这个是第二列的，第一行是序号，然后x呢，哦哦，他这种写法感觉就是套用呢，写的也不灵活啊，其实很多代码都可以不用写的啊，但是他为什

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

「已注销」

关注关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

OpenAI的成功经验对大模型企业的借鉴

AI天才研究院

12-04

1287

引言随着人工智能技术的飞速发展，大模型企业成为了这个领域的热门话题。OpenAI作为一家在人工智能领域具有重大影响力的大模型企业，其成功经验无疑为其他企业提供了宝贵的借鉴。本文旨在深入分析OpenAI的成功经验，探讨其对大模型企业的借鉴意义，以期为我国乃至全球的大模型企业的发展提供有益的启示。 OpenAI成立于2015年，由山姆·阿尔特曼、

AI应用架构师视角：AI技术引发的全球经济格局重构，你看懂了吗？

最新发布

小白菜的博客

07-29

949

本文将从AI应用架构师的独特视角，拆解AI技术栈（算力/算法/数据）如何通过"架构渗透"重塑产业价值链，分析中美欧等主要经济体的AI战略差异如何改写全球分工格局，并为企业与个人提供一套可落地的"AI经济适应性框架"。当OpenAI的GPT-4在代码生成、多模态理解上展现出超越人类的能力，当英伟达的H100芯片成为全球科技巨头争抢的"数字石油"，当中国的AI大模型在电商、金融等场景实现规模化落地——我们正站在一场由AI技术引发的全球经济重构的临界点上。AI重构全球经济格局的过程，既是挑战，更是机遇。

参与评论您还未登录，请先登录后发表或查看评论

【飞桨】【李宏毅机器学习训练营】作业二（年收入判断）分析

qq_37279375的博客

04-21

541

# 飞桨 #paddlepaddle #李宏毅机器学习特训营课程链接：https://aistudio.baidu.com/aistudio/course/introduce/1978 作业二（年收入判断）分析：包括写代码规范和二分类logistic regression，概率生成模型的原理分析，损失函数等。（小声BB：因为不会，所以一边写一边研究，主要抠细节）作业的题目要求：项目描述：二元分类是机器学习中最基础的问题之一，在这份教学中，你将学会如何实作一个线性...

百度飞桨—PM2.5预测

qq_45986917的博客

01-26

1628

项目1-PM2.5预测环境配置 import sys import pandas as pd import numpy as np #读取测试数据 data = pd.read_csv('work/hw1_data/train.csv', encoding = 'big5') print(data) #检查Python版本 print(pd.__version__) 预处理 #从第三列筛取 data = data.iloc[:, 3:] print(data) #筛掉未知数NA.

基于飞桨复现DMR模型，实现点击率预测

PaddlePaddle

07-27

814

点击左上方蓝字关注我们项目介绍本项目是笔者参加百度AIStudio举办的飞桨论文复现挑战赛（第三期）(https://aistudio.baidu.com/aistudio/competi...

基于paddle飞浆深度学习框架的LSTM时序数据预测demo

NCEPUautomation的博客

05-17

1357

基于paddle的LSTM时序数据预测demo

基于飞桨实现房价预测模型

weixin_49214939的博客

08-27

666

该部分笔记参考课程：https://aistudio.baidu.com/aistudio/projectdetail/717724 加载飞桨、numpy相关类库 #加载飞桨、numpy相关类库 import paddle import numpy as numpy import paddle.fluid as fluid #飞桨主库：fluid import paddle.fluid.dygraph as dygraph #dygraph动态图类库 #静态图模式（声明式编程范式，类比C++）：先编译

AIGC内容分享(十三)：2023年中国AIGC产业全景报告

之乎者也·的博客

01-10

1886

古人有云：日就月将，学有缉熙于光明。人类对人工智能学的潜心钻研终于再度获得重大突破，大模型的涌现能力与AIGC的应用普及为那不一定是AGI但一定更AI的未来提供了确定性的加速度。AI2.0时代的加速到来，不仅是把AI能力融入到现有应用中，更是未来产业范式的再塑造。AI正跳跃式地加速渗透进各行各业，推动一场新的生产力与创造力革命。AI产业链各环节参与者的角色功能、产品服务和应用生态可能将发生变化。

20210704-德邦证券-百度集团~SW-9888.HK-移动生态打造全链路营销平台，AI生态商业化加速带来广阔空间.pdf

07-06

5. 盈利预测与投资建议：报告中给出了百度集团未来三年的营业收入和归母净利润预测，以及基于这些预测的投资建议。 6. 风险提示：报告提醒投资者关注宏观经济波动、智能车业务发展不及预期和AI技术发展不及预期等...

学习飞浆（paddlepaddle）每日赚180

livingbody的专栏

04-23

1186

标题学习飞浆（paddlepaddle）每日赚180 为什么这么讲呢，百度大脑为学习飞浆爱好者提供每天12小时使用Tesla V100 32g的时间。而网上16g的Tesla V100一天使用费用就达到了180元，诸位，想想吧。而且百度大脑提供免费的固态硬盘，16g内存，各种加持的服务器来用，真是良心的不能再良心了。所谓有图有真相，我放几张图看看专家精心授课在7天的学习里，每天老师直播...

逐步回归法matlab代码-boston-model:实现神经网络模型，通过paddlepaddle（百度飞桨）预测波士顿的房价

05-21

逐步回归法matlab代码写在前面本文源于百度AI平台飞桨学院《》课程中我自己的心得和理解。本文旨在介绍使用飞桨框架构建神经网络过程，并从房价预测模型的理解和代码的构建角度来整理所学内容，不求详尽但求简洁明了。模型构建基本流程飞桨的模型覆盖计算机视觉、自然语言处理和推荐系统等主流应用场景，所有场景的代码结构完全一致，如所示。图1. 使用飞桨框架构建神经网络过程飞桨重写房价预测模型数据处理之前，需要先加载飞桨框架的相关类库。 #加载飞桨、Numpy和相关类库 import paddle.fluid as fluid import paddle.fluid.dygraph as dygraph from paddle.fluid.dygraph import Linear import numpy as np 1. 数据处理数据处理包含五个部分：数据导入、数据形状变换、数据集划分、数据归一化处理和封装load data函数。数据预处理后，才能被模型调用。数据处理的代码不依赖paddle框架实现，使用numpy库即可。对每个特征进行归一化处理，使得每个特征的取值缩放到0~

百度飞桨——python小白逆袭大神结营心得

01-21

很开心参加了百度飞桨深度学习的python小白逆袭大神的课程，课程是由中科院一线精英教师团队讲解Python基础，以及人工智能领域的图像识别，深度学习等，课程设计很完美，特别有层次感，架构清晰，环环相扣，同时也很照顾小白。课程介绍 1、课程内容从Python入手，绝对0基础，由浅入深，建立系统的知识体系。 2、7日打卡营，采用全程直播+录播+答疑+比赛，四位一体全方位互动，时间短见效快。 3、人工智能进阶用法，贴合实际场景，更匹配大厂工作需求。 4、CPU、GPU计算资源免费使用，为学习添砖加瓦。课程福利原创文章 1获赞 2访问量 69

AI Studio 飞桨零基础入门深度学习笔记6.3-手写数字识别之数据处理

qq_26765099的博客

08-18

1178

AI Studio 飞桨零基础入门深度学习笔记6.3-手写数字识别之数据处理）概述前提条件读入数据并划分数据集扩展阅读：为什么学术界的模型总在不断精进呢？训练样本乱序、生成批次数据校验数据有效性机器校验人工校验封装数据读取与处理函数异步数据读取概述上一节我们使用“横纵式”教学法中的纵向极简方案快速完成手写数字识别任务的建模，但模型测试效果并未达成预期。我们换个思路，从横向展开，如图1 所示，逐个环节优化，以达到最优训练效果。本节主要介绍手写数字识别模型中，数据处理的优化方法。图1：“横纵式”教学

【2022C4-AI】基于飞桨的分肾功能预测系统

m0_63642362的博客

11-26

616

本项目属于2022年中国高校计算机大赛（人工智能创意赛）创新组作品，旨在为广大医学同胞提供一次深度学习与医学三维图像分割的实践级尝试，给患者提供一种无创便捷的单侧肾脏功能预测系统。

用数据把脉设备状态，用飞桨实现预测性维护！

PaddlePaddle

05-31

347

随着技术的发展，工业设备设施故障的维护手段从早期的被动事后维护、定期预防性维护检修，逐渐演进到预测性维护。预测性维护可以减少机器故障、延长机械的使用寿命，有效降低维护成本；减少停机时间、提高生产产量及安全性，有效提升企业盈利。随着 5G 技术的发展和普及，万物互联的时代随之到来。当前预测性维护主要是依靠传感器收集设备信息数据，如何利用好信息时代的便利为生产制造设备保驾护航...

百度飞桨（Paddle）使用初体验

热门推荐

LYX的博客

04-08

1万+

疫情影响，静待家中，无心学习，难觅工作…… 学校的服务器也连不上，想蹭蹭百度的GPU，刚好看到了百度《深度学习7日入门CV》的课程与实践项目，美滋滋报了个名，也算是督促我开始每天学习了吧~ 环境安装与部署 AI Studio 平台网址：https://aistudio.baidu.com/aistudio/ 该平台有大量的课程、比赛可以参与，也有详细的新手指导，更有免费的GPU可以蹭，详细内容大...

小白入门深度学习的必修课——飞桨

LuckilyHaveYou的博客

05-04

1278

我与飞桨第一次听说飞桨是在百度的AI Studio课程《Python小白逆袭大神》当中。在此之前开始想往深度学习方向转型，在AI Studio发现有很多免费的课程。刚开始只是报着蹭课的心理来的。毕竟课程是免费的，就像在大学去旁听其它学院的课一般。刚开始以为只是发现一笔意外之财，在学习课程以及在了解了飞桨所具备的功能之后才发现。飞桨不仅是一笔财富，更是一把打开宝藏的钥匙。就像它所说的——“让深度...

百度飞桨 paddlepaddle 初体验

zhangneww的专栏

04-11

1434

这几天报名参加了百度的免费培训深度学习7日入门-CV疫情特辑，学到了好多东西，本来是有 Python 基础的，但是对算法不熟，磕磕绊绊的也都学了下来，感觉百度的 PaddlePaddle、PaddleHub、AI Studio 都还不错。百度 AI Studio深度学习平台是针对AI学习者的在线一体化开发实训平台。平台集合了AI教程, 深度学习样例工程, 各领域的经典数据集, 云端的超强运...

[我与飞桨的故事] -——一个小白为何坚定的选择PaddlePaddle（飞桨）入门人工智能

qq_43513350的博客

12-08

507

第一次认识飞桨，要从我大一开始说起了。当时我想做一个项目，语音识别，就网上到处查资料，碰巧，发现了百度大脑，里面有许多关于人工智能方面的API，我查阅了相关文档，发现挺好的一个平台，后面实际上我所做的AI项目都是调用百度大脑的返回参数接口。直到后来在百度大脑上偶然看到了关于飞桨的链接，我点进去简单了解了一下相关介绍，也没有明白什么是飞桨，之后的很长一段时间，好像都没有与飞桨产生任何关系，这是我第一次与飞桨擦肩而过。后来大一下学期，加入了学院的人工智能工作室，当时就觉得这个东西不高级，当时觉得自己...

飞桨ai 波士顿房价预测

05-24

### 使用飞桨 (PaddlePaddle) 实现波士顿房价预测以下是基于飞桨框架实现波士顿房价预测的一个完整示例，涵盖了数据处理、模型定义、训练以及测试的主要步骤。 #### 1. 导入必要的库首先需要导入飞桨及其子模块以及其他辅助工具： ```python import paddle import paddle.nn as nn from paddle.vision.datasets import DatasetFolder import numpy as np import matplotlib.pyplot as plt ``` 注意，在最新版本的飞桨中，推荐使用 `paddle.nn` 替代旧版中的 `paddle.fluid`[^3]。 --- #### 2. 加载并预处理数据波士顿房价数据集可以通过第三方库（如 `sklearn` 或其他方式）获取。这里假设已下载好数据集，并将其转换为适合飞桨使用的格式。 ```python # 假设已有波士顿房价数据集 X_train, y_train, X_test, y_test def load_data(): from sklearn.datasets import load_boston from sklearn.model_selection import train_test_split from sklearn.preprocessing import StandardScaler boston = load_boston() X = boston.data y = boston.target.reshape(-1, 1) # 划分训练集和测试集 X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) # 归一化处理 scaler = StandardScaler() X_train = scaler.fit_transform(X_train) X_test = scaler.transform(X_test) return X_train.astype('float32'), y_train.astype('float32'), \ X_test.astype('float32'), y_test.astype('float32') X_train, y_train, X_test, y_test = load_data() ``` 此部分实现了数据加载与标准化处理[^1]。 --- #### 3. 定义模型通过继承 `nn.Layer` 类来自定义一个简单的线性回归模型： ```python class RegressionModel(nn.Layer): def __init__(self): super(RegressionModel, self).__init__() self.fc = nn.Linear(in_features=13, out_features=1) # 输入特征数为13 def forward(self, inputs): outputs = self.fc(inputs) return outputs ``` 此处利用了飞桨的动态图机制 (`dygraph`) 和全连接层函数 `Linear` 来构建单层神经网络作为线性回归模型[^3]。 --- #### 4. 训练过程设置优化器、损失函数，并编写训练循环逻辑： ```python model = RegressionModel() # 设置超参数 learning_rate = 0.01 epochs = 500 # 定义优化器和损失函数 optimizer = paddle.optimizer.Adam(parameters=model.parameters(), learning_rate=learning_rate) loss_fn = nn.MSELoss() # 平方误差损失 train_losses = [] test_losses = [] for epoch in range(epochs): model.train() preds = model(paddle.to_tensor(X_train)) loss = loss_fn(preds, paddle.to_tensor(y_train)) optimizer.clear_grad() loss.backward() optimizer.step() train_losses.append(loss.numpy()[0]) # 验证阶段 model.eval() with paddle.no_grad(): test_preds = model(paddle.to_tensor(X_test)) test_loss = loss_fn(test_preds, paddle.to_tensor(y_test)).numpy()[0] test_losses.append(test_loss) print(f"Final Test Loss: {test_loss}") ``` 以上代码展示了如何配置 Adam 优化器以及 MSE 损失函数来进行模型训练[^2]。 --- #### 5. 可视化结果绘制训练过程中损失的变化曲线可以帮助分析模型性能： ```python plt.figure(figsize=(8, 6)) plt.plot(train_losses, label='Train Loss') plt.plot(test_losses, label='Test Loss', linestyle="--") plt.xlabel("Epochs", fontsize=14) plt.ylabel("Loss Value", fontsize=14) plt.title("Training and Testing Loss Over Epochs", fontsize=16) plt.legend(fontsize=12) plt.show() ``` 这一步有助于直观了解模型收敛情况。 --- ### 总结上述流程覆盖了一个完整的波士顿房价预测任务实施方法，包括但不限于数据准备、模型搭建、训练评估及可视化展示等内容。值得注意的是，实际项目可能还需要进一步调整超参或引入更复杂的架构以提升效果。