Python中数值计算、表格处理和可视化的应用
1.数值计算:Numpy
import numpy as np
1.1创建数组
import numpy as np
arr1 = np.array([[1,2,3,4,5]])
print(arr1)
print(type(arr1))
print("数组形状",arr1.shape)
arr2 = np.array([[1,2,3],[2,3,4]])
print(arr2)
print(type(arr1))
print("数组形状",arr2.shape)
上面运行结果我们能够看到,创建出的数组类型为<class 'numpy.ndarray'>
同时我们用arr1.shape查数组形状,要注意的是这个并不是函数调用shape后不用加()
1.2索引和切片
索引:
arr[0]
切片:
arr[0:3]
注意:切片中我们采用前包后闭原则,调用0、1、2三个位置的数。
1.3运算
加法、减法、乘法、除法:
print([1,2,3]+[4,5,6])
print(np.array([1,2,3])+np.array([4,5,6]))
print(np.array([1,2,3])-np.array([4,5,6]))
print(np.array([1,2,3])*np.array([4,5,6]))
print(np.array([1,2,3])/np.array([4,5,6]))
我们能够看到第一行是在后面直接衔接,而后面四行直接在原数组上计算。
1.4.数组形状操作
arr2 = np.array([[1,2,3],[2,3,4]])
print("数组形状",arr2.shape)
print(arr2.reshape(1,6))
print(arr2.transpose())
arr2.resgape()函数是将多个数组按照一比一的个数任意改变格式。
arr2.transpose()是将原本的数组转置。
1.5.线性代数
import numpy as np
arr3 = np.array([1,2,3,4,5])
arr4 = np.array([2,3,4,5,6])
# 点乘
print("点乘",np.dot(arr3,arr4))
# 平均值
print("arr3平均值",np.mean(arr3))
print("arr4平均值",np.mean(arr4))
# 最大
print("arr3最大值",np.max(arr3))
print("arr4最大值",np.max(arr4))
# 最小值
print("arr3最小值",np.min(arr3))
print("arr4最小值",np.min(arr4))
# 标准差
print("arr3标准差",np.std(arr3))
print("arr4标准差",np.std(arr4))
# 排序
print("arr3排序",np.sort(arr3))
print("arr4排序",np.sort(arr4))
# 筛选
print("arr3筛选",arr3[arr3<3])
print("arr4筛选",arr3[arr3<3])
# 求和
print("arr3求和",np.sum(arr3))
print("arr4求和",np.sum(arr4))
1.6.数据的保存和导入
# 保存
npy = np.save("arr",arr)
#导入
arr = np.load("arr.npy")
2.表格处理:Pandas
import pandas as pd
# 读取表
data = pd.read_excel("C:/Users/ASUS/Desktop/练习数据1.xlsx")
2.1预处理
# 预处理
print(data.info())
2.2缺失值处理
# 缺失值处理
print(data.dropna())