1、利用字典生成DataFrame
① 第一种方式:列表组成的字典
"name":["张三","李四","王燕"], "age":[18,20,22], "sex":["男","男","女"] } df=pd.DataFrame(stu) display(df)stu={
结果如下:
② 第二种方式:上述方式的一般形式
"name":"Tom", "age":20, "subject":["Python","Java","Excel"] } df=pd.DataFrame(person) display(df)person={
结果如下:
③ 列表组成的列表
df=pd.DataFrame(data) display(df)x=[[1,2,3,4],[5,6,7,8],[9,10,11,12]]
结果如下:
④ 字典组成的列表
{"one":1,"two":2}, {"one":5,"two":10,"three":15} ] df=pd.DataFrame(data) display(df)data=[
结果如下:
⑤ 字典组成的字典
"张三":{"Java":90,"Python":89,"Hive":78}, "李四":{"Java":82,"Python":95,"Hive":96}, "王五":{"Java":85,"Python":94} } df=pd.DataFrame(data) display(df) data={ "Java":{"张三":90,"李四":82,"王五":85}, "Python":{"张三":89,"李四":95,"王五":94}, "Hive":{"张三":78,"李四":96} } df=pd.DataFrame(data) display(df)data={
结果如下:注意:对于上述两个DataFrame,我们直接可以使用data.T进行DataFrame行、列之间的转换。
⑥ 由Series或ndarray组成的字典
"Java":pd.Series(np.random.randint(70,100,5)), "Python":np.random.randint(80,100,5) } df=pd.DataFrame(data) display(df)data={
结果如下:
2、自定义列、索引、数据生成DataFrame
dates=pd.date_range("0202",periods=5) df=pd.DataFrame(np.random.randint(low=70,high=100,size=(5,3)), index=dates,columns=column) display(df)column=["Python","Java","Excel"]
结果如下:注意:这里有两个知识点需要掌握,一个是pd.date_range(),一个np.random.randint(),知道怎么用就行了,详细说明请自行百度。
3、利用二维数组生成DataFrame(常用)
index=list("abcde") df=pd.DataFrame(x,index=index) display(df)x=np.arange(1,21).reshape(4,5)
结果如下:
4、将不同的列表转化为tuple,生成DataFrame
piapofang=[str(x)+"亿"forxin[56.39,49.34,46.18,36.22]] list_to_tuple=list(zip(movie,piaofang)) df=pd.DataFrame(list_to_tuple,columns=["movies","piaofang"]) display(df)movie=["战狼2","哪吒之魔童降世","流浪地球","红海行动"]
结果如下:
5、通过读取sql,csv,excel等文件生成DataFrame
以后工作中都是利用已有的文件,进行数据分析。
最好的方式就是将文件读取成DataFrame方式,然后利用各种方式进行数据处理。
由于文件格式众多,这里不细说,你需要读取哪一种文件,就自行百度学习一下,即可。