pandas Dataframe介绍以及创建
简介
DataFrame
是 Pandas 中最常用的二维数据结构,可以看作是带有行索引和列标签的二维数组,类似于电子表格或 SQL 表。pandas
:series
一维数据 行- 值1 值2 值3 值4
- 一维数据结构很难表示 对应的数据
DataFrame
二维数据 行 列- 二维数据结构:每一行表示一条记录,每一个列表示一个字段
- 有行索引和列标签:
- 行索引表示每一行
- 列标签表示每一列
DataFrame
定义数据的格式:
{
"列标签1":["值1","值2","值3",.....],
"列标签2":["值1","值2","值3",.....],
"列标签3":["值1","值2","值3",.....]
}
创建数据 字典嵌套列表格式
# 字典嵌套列表
# 引用
import pandas as pd
# 定义字典 二维
dist = {
"name":['张三','李四','王五'],
"age":[13, 34, 56],
"sex":['男','女','男']
}
# 创建DataFrame
df = pd.DataFrame(dist)
# 输出
print(df)
结果:
name age sex
0 张三 13 男
1 李四 34 女
2 王五 56 男
列表嵌套列表
- 这种方式需要自己定义列标题
# 列表嵌套列表
# 引用
import pandas as pd
# 定义数据
data = [
['张三','男',18],
['李四','男',28],
['王五','女',38],
]
# 定义列标题
columns = ['name','age','sex']
# 创建 DataFrame
df = pd.DataFrame(data,columns = columns)
# 输出
print(df)
结果:
name age sex
0 张三 男 18
1 李四 男 28
2 王五 女 38
列表里嵌套字典
-
就是在列表中的值是字典
-
[ {键1;值1,键2:值2} ]
# 列表里嵌套字典 # 引用pandas import pandas as pd # 定义 数据 data = [ {'name':'zhang','age':18,'sex':'man'}, {'name':'li','age':28,'sex':'woman'}, {'name':'wang','age':38,'sex':'man'}, ] # 创建DataFrame df = pd.DataFrame(data) # 输出 print(df) 结果: name age sex 0 zhang 18 man 1 li 28 woman 2 wang 38 man
使用Numpy
定义数组
-
如果需要使用
Numpy
,必须先安装 在终端中写入pip install Numpy
安装,并 引用 引用方式与pandas一样 -
Numpy
是python
中的数值计算库,可以提供一个数组和多维数据的定义,和各种数组处理工具 -
使用
Numpy
创建数组:-
一维数组:
-
# Numpy # 引用Numpy import numpy as np # 定义一维数组 arr1 = np.array([1,2,3,4]) # 输出 print(arr1) 结果; [1 2 3 4]
-
二维数组
-
# 二维数组 arr2 = np.array( [ [1,2,3,4], [2,3,4,5], [3,4,5,6] ] ) # 输出 print(arr2) 结果: [[1 2 3 4] [2 3 4 5] [3 4 5 6]]
-
-
创建DataFrame
-
# 引用pandas import pandas as pd # 创建 DataFrame df = pd.DataFrame(arr2,columns = ['a','b','c','d']) # 输出 print(df) 结果; a b c d 0 1 2 3 4 1 2 3 4 5 2 3 4 5 6
-