Pandas数据结构(DataFrame,字典赋值)
DataFrame是矩形的数据表,它含有一组有序且有命名的列,每一列可以是不同的数据类型(数值、字符串、布尔值等)。
DataFrame既有行索引也有列索引,可以看作由共用同一个索引的Series组成的字典。
(1)等长列表构成的字典创建DataFrame
import pandas as pd data={"China":["北京","上海","南京","杭州"],"USA":["芝加哥","华盛顿","纽约","阿拉斯加"],"England":["伦敦","曼彻斯特","利物浦","利兹联"]} frame=pd.DataFrame(data) print(frame)
China USA England 0 北京 芝加哥 伦敦 1 上海 华盛顿 曼彻斯特 2 南京 纽约 利物浦 3 杭州 阿拉斯加 利兹联
import pandas as pd data={"China":["北京","上海","南京","杭州"],"USA":["芝加哥","华盛顿","纽约","阿拉斯加"],"England":["伦敦","曼彻斯特","利物浦","利兹联"]} frame=pd.DataFrame(data) print(frame.head(2))
China USA England 0 北京 芝加哥 伦敦 1 上海 华盛顿 曼彻斯特
frame.head(2)用于显示后两行,frame.tail(2)用于显示后两行。
(2)按指定列排序:frame=pd.DataFrame(data,columns=["China","England","USA"])
import pandas as pd data={"China":["北京","上海","南京","杭州"],"USA":["芝加哥","华盛顿","纽约","阿拉斯加"],"England":["伦敦","曼彻斯特","利物浦","利兹联"]} frame=pd.DataFrame(data,columns=["China","England","USA"]) print(frame)
China England USA 0 北京 伦敦 芝加哥 1 上海 曼彻斯特 华盛顿 2 南京 利物浦 纽约 3 杭州 利兹联 阿拉斯加
frame=pd.DataFrame(data,columns=["China","England","USA"]),用于指定列的顺序,指定后顺序由China,USA,England变成了China,England,USA输出一列的值
import pandas as pd data={"China":["北京","上海","南京","杭州"],"USA":["芝加哥","华盛顿","纽约","阿拉斯加"],"England":["伦敦","曼彻斯特","利物浦","利兹联"]} frame=pd.DataFrame(data,columns=["China","England","USA"]) print(frame["China"])
0 北京 1 上海 2 南京 3 杭州 Name: China, dtype: object