300字范文 > pandas时间序列空值填充

pandas时间序列空值填充

时间：2022-04-29 00:04:52

相关推荐

pandas时间序列空值填充

1.读入csv文件

novels_month = pd.read_csv(csv_path)

2.生成时间索引

#-12-1是时间序列开始的时间，并以月为间隔rng = pd.date_range('-12-1', periods = int((pd.Period(novels_month.iloc[-1,0],'M') - pd.Period('-12-1','M')).freqstr[0:-1]), freq = 'M') + pd.Timedelta('1 day')s = pd.Series(rng)

3.生成一个空的DataFrame

empty = pd.DataFrame([],columns=["update_date","rating_total"])empty["update_date"] = sempty

4.填充DataFrame

#这里是使用的临近值进行填充c_list = list(novels_month[0]["update_date"]);counter = 2 #novels_month的第一个非空值的位置for i in range(len(empty)):f_val = str(pd.Period(empty.iloc[i,0],'M'))if f_val in c_list:val = novels_month[0].iloc[c_list.index(f_val),1]empty.iloc[i,1] = valcounter = c_list.index(f_val)else:#将值填充为最邻近的一个值empty.iloc[i,1] = novels_month[0].iloc[counter,1]

5.重新保存csv文件

empty.to_csv(os.path.join(NOVEL_PATH,"test.csv"), index_label="index_label")

6.补充

使用fillna进行值的填充

# 通过fillna填充缺失值 # /p/79086fa52803median = housing["total_bedrooms"].median() sample_incomplete_rows["total_bedrooms"].fillna(median, inplace=True) # option 3 sample_incomplete_rows

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。