这篇文章给大家分享的是有关pandas中resample如何按时间聚合的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。
如下所示:
import pandas as pd
#如果需要的话,需将df中的date列转为datetime
df.date = pd.to_datetime(df.date,format="%Y%m%d")
#将改好格式的date列,设置为df的index
df.set_index('date',drop=True)
#按年来提数据 (因为此时的datetime已经为index了,可以直接[]取行内容)
df['2018']
df['2018':'2021']
#按月来提数据
df['2018-01']
df['2018-01':'2018-05']
#按天来提出数据
df['2018-05-24':'2018-09-27']
#按日期汇总数据
#将数据以W星期,M月,Q季度,QS季度的开始第一天开始,A年,10A十年,10AS十年聚合日期第一天开始.的形式进行聚合
df.resample('W').sum()
df.resample('M').sum()
#具体某列的数据聚合
df.price.resample('W').sum().fillna(0) #星期聚合,以0填充NaN值
#某两列
df[['price','num']].resample('W').sum().fillna(0)
#某个时间段内,以W聚合,
df["2018-5":"2018-9"].resample("M").sum().fillna(0)
还有以下方式聚合
感谢各位的阅读!关于“pandas中resample如何按时间聚合”这篇文章就分享到这里了,希望以上内容可以对大家有一定的帮助,让大家可以学到更多知识,如果觉得文章不错,可以把它分享出去让更多的人看到吧!