数据分析预备篇---NumPy数组
NumPy是数据分析时常用的库,全称为Numerical Python,是很多数据或科学相关Python包的基础,包括pandas,scipy等等,常常被用于科学及工程领域。NumPy最核心的数据结构是ND array,意思是N维数组。
#以下是一个普通列表的操作示例:arr = [5,17,3,26,31]#打印第一个元素
print(arr[0])#打印前三个元素
print(arr[0:3])#打印所有元素
for element in arr:print(element)
NumP数组 vs Python列表
相似之处
1.可以通过索引去获取某个元素
2.可以通过切片获取某范围的多个元素
3.可以迭代各个元素
不同之处
1.NumPy数组里的元素必须是同一类型的;列表则没有要求,数据元素可以不统一。这样的好处是在对NumPy数组进行大规模数据运算或其它操作时,执行速度远高于Python内置列表,因此效率是数据处理方面选择NumPy的首要原因。
2.NumPy提供了很多专门做运算的函数,例如求平均值,求中位数,求方差等等,为操作数据提供了很多便利。
NumPy的安装
NumPy是第三方库,需要先安装再使用:
- Windows操作系统,在菜单栏搜索cmd,进入命令提示符,输入pip install numpy
- macOS系统点击顶部菜单栏放大镜图标,输入“终端”或“terminal”,回车进入,输入pip3 install numpy,然后回车,就开始安装了。
安装完成后就可以在Jupyter Notebook中使用NumPy了。
NumPy的使用
导入numpy库
import numpy as