
pandas
石小秀1995
微信公众号:女朋友教我写代码
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
pandas多表合并merge
pandas多表合并的方法之前很多资料都有如何两表merge的方法,然而对多表却很少。这里,用reduce+merge的方法,得以实现。merge multiple data frame :from functools import reducedfs = [df0, df1, df2, dfN]df_final = reduce(lambda left,right: pd.merge...原创 2019-01-13 17:09:37 · 12775 阅读 · 3 评论 -
python:OSS批量下载文件
注意事项conda中无法调用oss2,即使在terminal中显示安装成功,在jupyter notebook依然会显示‘no module named oss2 ’。所以,要使用oss2的话,必须只能在虚拟环境,或者pycharm中。bucket与object的定义bucketName:根据https://help.aliyun.com/document_detail/320...原创 2019-01-18 17:36:25 · 5494 阅读 · 0 评论 -
pandas 取isin区间数据,index isin
isin只能输入一个一个的数据,而不能用冒号直接表示区间。那么,可以用np.linspace()创建出list,加入到isin函数中进行下一步计算。mask = df['time'].isin(list(np.linspace(132,135,num=(135-131))))df[mask]记得num的个数哦!...原创 2019-02-15 10:37:58 · 2355 阅读 · 0 评论 -
python: 多重复合and & or
functiondef tt(a,b): trend = [] if b == 0 or b == 3 or b == 7 or b == 4 or (a == 0 or a ==1 or a == 5 and b == 2) or (a == 5 and b == 6): trend.append(1) elif b == 5 or (a ==2 or ...原创 2019-01-30 11:19:07 · 2935 阅读 · 0 评论 -
python: 对Series中的每一个数据做运算
问题描述最近~ 发现对series里的元素操作挺复杂的,用for loop + Series.iloc[i]会发生卡死的状况,那么,lambda是解决办法:error 1ratings['timestamp'] = ratings['timestamp'].apply(ratings['timestamp'].iloc[i].strftime("%Y-%m-%d %H:%M:%S", t...原创 2019-02-10 00:25:56 · 8530 阅读 · 0 评论 -
Python实锤:谁是带资进组最霸道的烂片之王?
业界啊,关于谁演技好,一般都是有口皆碑。关于谁演技差,嗯… 那可不许说。关于到底谁,才是带资进组的实锤的明星,那瓜可就不止一个了。今天呢,就让我们用数据的方式,带你走近科学,额不,走进娱乐圈。首先,祭出“劳模与影帝影后图”。下面这个柱状图表示表示的是每个演员出演的部数,和出演电影的平均分。在第一小梯队,黄渤荣获了一个局部最高分和一个最不劳模的称号:电影平均评分6.28,参演电影仅为1...原创 2019-03-16 00:12:02 · 239 阅读 · 0 评论 -
pandas-profiling
import sys !{sys.executable} -m pip install pandas-profilingimport numpy as npimport pandas as pdimport pandas_profiling as ppdf = pd.DataFrame(np.random.rand(100, 5),columns=[‘a’, ‘b’, ‘c’, ‘...原创 2019-08-19 10:33:18 · 895 阅读 · 0 评论