自学python第10天
自上次五月底拿到某大厂offer后,发现干乙方太折寿,干了三个星期火速跑路,换了一家新的甲方大厂,干起了安全合规。每天都在看法律条款,无聊无聊头大头大。
怎么一眨眼就八月了,迫不得已为了秋招之路开启python临时抱佛脚之冲刺。直接学pandas吧。Pandas 教程 | 菜鸟教程。
至少一天一道pandas的笔试题,监督一下自己,说不定python半道崩殂就拿到Offer了哈哈哈哈(做梦中)
今日任务:
import pandas as pd
数据结构
-
Series 类似于一维数组或列表,是由一组数据以及与之相关的数据标签(索引)构成。Series 可以看作是 DataFrame 中的一列,也可以是单独存在的一维数据结构。
-
DataFrame类似于一个二维表格,它是 Pandas 中最重要的数据结构。DataFrame 可以看作是由多个 Series 按列排列构成的表格,它既有行索引也有列索引,因此可以方便地进行行列选择、过滤、合并等操作。
DataFrame由index、Key和Value组成
创建一个DataFrame
- 直接创建一个DataFrame
import pandas as pddata = { 'Name' : ['小明' , '小张' , ' 小王'], 'age' : [12 , 13, 14] }
df = pd.Dataframe(data)
print(df)
- 通过Series拼接一个DataFrame
import pandas as pddata1 = pd.Series([1,2,3])
data2 = pd.Series([5,6,7])df = pd.DataFrame({'A1': data1, 'A2': data2})
print(df)
- 将一个二维列表转换为一个DataFrame,通过columns制定列名
student_data=[[1, 15],[2, 11],[3, 11],[4, 20]
]
column_names = ['student_id','age']
df = pd.DataFrame(student_data,columns = column_names)
print(df)
DataFrame和Series的维度
df.shape() 以元组形式(行数,列数)返回DataFrame或Series的维度
shape[0]返回行数
shape[1]返回列数