创建列表遍历dataframe_如何遍历DataFrame并生成新的DataFrame

最新推荐文章于 2025-02-23 10:36:40 发布

塞音菩光

最新推荐文章于 2025-02-23 10:36:40 发布

阅读量457

点赞数

CC 4.0 BY-SA版权

文章标签：创建列表遍历dataframe

本文链接：https://blog.csdn.net/weixin_28831399/article/details/112842739

本文介绍如何检查DataFrame中'L'列是否存在值，如果存在，则根据'L'和'P'列的值生成新的DataFrame。当'L'列有多个值时，会创建多行记录。提供的解决方案涉及对'L'列进行拆分、堆叠和重新组合操作，最终删除包含NaN的行。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

I have a data frame looks like this:

P Q L

1 2 3

2 3

4 5 6,7

The objective is to check if there is any value in L, if yes, extract the value on L and P column:

P L

1 3

4,6

4,7

Note there might more than one values in L, in the case of more than 1 value, I would need two rows.

Bellow is my current script, it cannot generate the expected result.

df2 = []

ego

other

newrow = []

for item in data_DF.iterrows():

if item[1]["L"] is not None:

ego = item[1]['P']

other = item[1]['L']

newrow = ego + other + "\n"

df2.append(newrow)

data_DF2 = pd.DataFrame(df2)

解决方案

First I extract multiple values of column L to new dataframe s with duplicity index from original index. Remove unnecessary columns L and Q. Then output join to original df and drop rows with NaN values.

print df

P Q L

0 1 2 3

1 2 3 NaN

2 4 5 6,7

s = df['L'].str.split(',').apply(pd.Series, 1).stack()

s.index = s.index.droplevel(-1) # to line up with df's index

s.name = 'L'

print s

0 3

2 6

2 7

Name: L, dtype: object

df = df.drop( ['L', 'Q'], axis=1)

df = df.join(s)

print df

P L

0 1 3

1 2 NaN

2 4 6

2 4 7

df = df.dropna().reset_index(drop=True)

print df

P L

0 1 3

1 4 6

2 4 7

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

塞音菩光

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

dataframe类型数据的遍历_pandas中遍历dataframe的每一个元素

weixin_39798943的博客

12-23

3733

假如有一个需求场景需要遍历一个csv或excel中的每一个元素，判断这个元素是否含有某个关键字那么可以用python的pandas库来实现。方法一：pandas的dataframe有一个很好用的函数applymap，它可以把某个函数应用到dataframe的每一个元素上，而且比常规的for循环去遍历每个元素要快很多。如下是相关代码：import pandas as pddata = [["str"...

r生成新的dataframe_R语言Data Frame数据框常用操作

weixin_39850150的博客

12-19

3175

Data Frame一般被翻译为数据框，感觉就像是R中的表，由行和列组成，与Matrix不同的是，每个列可以是不同的数据类型，而Matrix是必须相同的。Data Frame每一列有列名，每一行也可以指定行名。如果不指定行名，那么就是从1开始自增的Sequence来标识每一行。初始化使用data.frame函数就可以初始化一个Data Frame。比如我们要初始化一个student的Data Fr...

参与评论您还未登录，请先登录后发表或查看评论

如何遍历 DataFrame

鸭梨的博客

02-23

913

方法适用场景性能备注iterrows()逐行遍历，小规模数据低返回 Series逐行遍历，中等规模数据中返回命名元组items()按列遍历中返回列名和列数据apply()批量操作行或列中高灵活，适合复杂操作直接遍历不推荐低无法访问列名向量化操作高性能操作，推荐高避免显式遍历根据数据规模和需求选择合适的方法，优先考虑向量化操作和apply()。

Python开发之DataFrame数据的多种遍历方法

热门推荐

等待着冬天的风的博客

01-02

3万+

主要介绍DataFrame数据的多种遍历方法

pandas DataFrame 常用遍历方法

xiaoyuzhou1994的博客

05-12

2085

基于行号遍历DataFrame的每一行, 该方式通过行号获取行数据信息，格式为Series，无法获取改行的index信息。在Pandas中，可以使用多种方法遍历DataFrame中的数据。使用itertuples()遍历DataFrame的每一行，返回一个元组。apply() 函数可以对DataFrame中的每个元素应用一个函数。使用apply()函数遍历DataFrame的每一行或列。使用iterrows()遍历DataFrame的每一行。基于索引遍历DataFrame的每一行。

Python pandas 对DataFrame进行遍历(持续更新）

dynsyx的博客

02-25

9530

后续持续更新。有错误的地方请指正

pandas遍历dataframe的几种方法

shannya_zhima的博客

02-03

1万+

在pandas中dataframe可以一维格式化的二维数据，是一个很清晰数据表，那你知道如何遍历这个数据表吗？本文介绍pandas遍历dataframe方法：1、使用df.iterrows()获取可迭代对象, 然后使用for循环遍历；2、使用applymap()函数遍历dataframe所有元素；3、按行遍历迭代成元组。方法一：使用df.iterrows()获取可迭代对象, 然后使用for循环遍历即可 for index, row in df.iterrows(): print(index, ro

在pandas中遍历DataFrame行的实现方法

09-18

本文将详细介绍四种不同的方法来遍历DataFrame的行，并解释每种方法的工作原理和适用场景。首先，我们创建了一个简单的DataFrame，如下所示： ```python import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1'...

如何遍历DataFrame的每列

09-16

以上是通过遍历列名来遍历DataFrame的每一列，并使用`.iloc`方法访问每列的数据。当然，也可以使用`.loc`方法，根据需要使用不同的访问方法。 ### 回答3：要遍历DataFrame的每一列，可以使用DataFrame的`columns`...

pyspark 遍历

大柳的博客

09-17

7668

最近遇到一个小问题，我要用pyspark实现数据表的行列遍历，在python里很容易实现，但是用pyspark没实现过，遇到一点小问题，但摸索了一会也实现了，记录如下：描述下表（data1）为某数据大宽表（data2）各列缺失数据的处理方法配置表，其中COLUMN_NAME为数据大宽表的特征名称，NULL_PROCESS_METHON为各特征列缺失数据的处置办法，假设处理方式共有4种：drop、zero、mean、other。需求遍历配置表（data1）的COLUMN_NAME，获取相应的缺失值处

用iloc, loc构造一个新的dataframe

ouyangbiwu的博客

11-16

281

loc, iloc

python&pandas | 循环生成新的dataframe后叠加

ASKCOS博客

07-23

7610

def func(): pass result = [] for t in dates: result.append(func(t)) print (pd.concat(result, axis=1))

DataFrame的三种遍历操作和其他基本操作以及和series的区别

rengarofzg的博客

05-10

1676

DataFrame既有行索引也有列索引，它可以被看做由Series组成的字典（共同用一个索引）pd.set_option('display.colheader_justify', 'left') # 设置列标题靠左。它由一组数据（各种Numpy数据类型）以及一组与之相关的数据标签（即索引）组成。pd.set_option('display.max_columns', None) # 设置列数为无限制。pd.set_option('display.max_rows', None) # 设置行数为无限制。

python如何从一个dataframe提取相应的行组成一个新的dataframe_Python|专题（1）——数据处理常规操作集（1）...

weixin_39927378的博客

11-20

3798

大家好！好久不见！适逢国庆，先祝我亲爱的祖国七十周年生日快乐！这一系列文章是针对最近在实习中做的一些数据预处理操作的整理。我们希望通过它们，带领大家了解和熟悉一些python做数据清洗，数据整合等的常见操作。请注意我们这是专题文章，也就是说这一系列文章并不假设你对python是零基础的。但是如果你和我一样，也是一个数据科学中探索的小白，那么我希望你也能够通过这些文章，在一个一个的数据处理的坑中爬起...

Pandas | 遍历行、遍历列

白帽阿叁的博客

12-15

1万+

Pandas遍历DataFrame的行迭代range(len(df))迭代df.iterrrows()迭代df.itertuples()Pandas遍历DataFrame的列迭代df.items()迭代df.columns。

DataFrame 遍历访问方法

六月闻君

10-24

567

遍历访问dataframe的5种方法，pandas版本是V2.0版。

如何在 Pandas 中遍历 DataFrame 的行？

cda2024的博客

12-11

1607

在数据科学领域，Pandas 是一个不可或缺的工具，它为数据操作和分析提供了强大的支持。对于许多数据科学家和工程师来说，Pandas 的 DataFrame 是处理结构化数据的首选工具。然而，在实际应用中，我们经常需要对 DataFrame 的每一行进行特定的操作，比如数据清洗、特征工程或模型预测。本文将深入探讨如何在 Pandas 中高效地遍历 DataFrame 的行，并提供一些实用的技巧和最佳实践。

DataFrame数据的多种遍历方法

qq_53226437的博客

04-18

1万+

后续补充：遍历DataFrame的三种方法： iteritem()方法返回一个<class ‘method’>数据,可利用for循环获得输出 iterrow()方法返回一个<class ‘generator’>数据,可利用for循环获得输出 itertuple()方法返回一个<class ‘pandas.core.frame.Pandas’>数据,可利用getattr(row,‘列索引’)方法获得对应数据演示数据准备： data = {'state':['Ohio

python基础库-----Pandas（02）

2301_76155335的博客

02-09

1523

loc 方法通常用于按标签访问行数据，并可以选择性地指定这些行中的哪些列row_indexer：行标签或布尔数组。column_indexer：列标签或布尔数组。注意事项：df.loc[] 只能使用标签索引，不能使用整数索引。当通过标签索引的切片方式来筛选数据时，它的取值前闭后闭，能够取到终止值。1.如果选择单行或单列，返回的数据类型为Series2.选择多行或多列，返回的数据类型为DataFrame。

或者怎么遍历dataframe中的数据

创建列表 遍历dataframe_如何遍历DataFrame并生成新的DataFrame

创建列表遍历dataframe_如何遍历DataFrame并生成新的DataFrame