1.读入csv文件
novels_month = pd.read_csv(csv_path)
2.生成时间索引
#-12-1是时间序列开始的时间,并以月为间隔rng = pd.date_range('-12-1', periods = int((pd.Period(novels_month.iloc[-1,0],'M') - pd.Period('-12-1','M')).freqstr[0:-1]), freq = 'M') + pd.Timedelta('1 day')s = pd.Series(rng)
3.生成一个空的DataFrame
empty = pd.DataFrame([],columns=["update_date","rating_total"])empty["update_date"] = sempty
4.填充DataFrame
#这里是使用的临近值进行填充c_list = list(novels_month[0]["update_date"]);counter = 2 #novels_month的第一个非空值的位置for i in range(len(empty)):f_val = str(pd.Period(empty.iloc[i,0],'M'))if f_val in c_list:val = novels_month[0].iloc[c_list.index(f_val),1]empty.iloc[i,1] = valcounter = c_list.index(f_val)else:#将值填充为最邻近的一个值empty.iloc[i,1] = novels_month[0].iloc[counter,1]
5.重新保存csv文件
empty.to_csv(os.path.join(NOVEL_PATH,"test.csv"), index_label="index_label")
6.补充
使用fillna进行值的填充
# 通过fillna填充缺失值 # /p/79086fa52803median = housing["total_bedrooms"].median() sample_incomplete_rows["total_bedrooms"].fillna(median, inplace=True) # option 3 sample_incomplete_rows