当前位置: 首页 > news >正文

pandas、numpy 和 matplotlib 三个数据科学常用库的核心指令整理

 pandas、numpy 和 matplotlib 三个数据科学常用库的核心指令整理,涵盖各自的主要功能和典型用法:

一、NumPy(数值计算库)

NumPy 是科学计算的基础,专注于多维数组(ndarray的高效操作,支持大量数学运算。

指令功能示例
np.array()创建数组arr = np.array([1,2,3])(1D 数组);arr = np.array([[1,2],[3,4]])(2D 数组)
np.arange()生成等差数列np.arange(0, 10, 2) → [0,2,4,6,8]
np.linspace()生成等间隔数列np.linspace(0, 1, 5) → [0,0.25,0.5,0.75,1]
np.zeros() / np.ones()创建全 0 / 全 1 数组np.zeros((2,3))(2 行 3 列全 0 数组)
arr.shape查看数组形状arr = np.array([[1,2],[3,4]]); arr.shape → (2,2)
arr.reshape()改变数组形状arr.reshape(1,4)(将 2×2 数组转为 1×4)
np.mean() / np.sum()计算均值 / 总和np.mean(arr)np.sum(arr, axis=0)(按列求和)
np.max() / np.min()找最大值 / 最小值np.max(arr)np.min(arr, axis=1)(按行求最小值)
np.dot()矩阵乘法a = np.array([[1,2],[3,4]]); b = np.array([[5,6],[7,8]]); np.dot(a,b)
np.concatenate()拼接数组np.concatenate([a,b], axis=0)(纵向拼接)
np.random.rand()生成 0-1 随机数np.random.rand(2,2)(2×2 随机数组)

二、Pandas(数据处理库)

Pandas 基于 NumPy,提供了 Series(一维)和 DataFrame(二维表格)数据结构,专注于数据清洗、分析和处理。

指令功能示例
pd.Series()创建一维序列s = pd.Series([1,2,3], index=['a','b','c'])
pd.DataFrame()创建二维表格df = pd.DataFrame({'name':['A','B'],'age':[20,30]})
pd.read_csv() / pd.read_excel()读取文件df = pd.read_csv('data.csv')df = pd.read_excel('data.xlsx')
df.head(n) / df.tail(n)查看前 n / 后 n 行df.head(5)(默认前 5 行)
df.info()查看数据信息(类型、缺失值等)df.info()
df.describe()统计数值列的基本特征(均值、标准差等)df.describe()
df['col'] / df.loc[] / df.iloc[]选择数据df['age'](选列);df.loc[0:2, ['name','age']](按标签选行 / 列);df.iloc[0:2, 0:2](按位置选)
df.dropna() / df.fillna()处理缺失值df.dropna()(删除含缺失值的行);df.fillna(0)(用 0 填充缺失值)
df.drop_duplicates()去除重复行df.drop_duplicates(subset='name')(按 name 去重)
df.groupby()分组聚合df.groupby('gender')['age'].mean()(按 gender 分组求 age 均值)
pd.merge()合并表格(类似 SQL join)pd.merge(df1, df2, on='id')(按 id 列合并)
pd.concat()拼接表格pd.concat([df1, df2], axis=0)(纵向拼接)
df.apply()对行列应用函数df['age'].apply(lambda x: x+1)(age 列加 1)

三、Matplotlib(数据可视化库)

Matplotlib 是基础可视化工具,主要通过 pyplot 模块绘制各类图表。

指令功能示例
plt.plot()绘制折线图x = [1,2,3]; y = [4,5,6]; plt.plot(x, y)
plt.scatter()绘制散点图plt.scatter(x, y, color='red')
plt.bar() / plt.barh()绘制柱状图 / 横向柱状图plt.bar(['A','B'], [10,20])
plt.hist()绘制直方图(分布)plt.hist(df['age'], bins=10)(age 列的分布,分 10 组)
plt.title() / plt.xlabel() / plt.ylabel()设置标题和轴标签plt.title('标题'); plt.xlabel('X轴')
plt.legend()添加图例plt.plot(x,y, label='线1'); plt.legend()
plt.show()显示图像所有绘图操作后调用,显示图表
plt.savefig()保存图像plt.savefig('figure.png', dpi=300)(保存为 PNG,分辨率 300)
plt.subplot() / plt.subplots()创建子图plt.subplot(2,1,1)(2 行 1 列的第 1 个子图);fig, axes = plt.subplots(2,2)(2×2 子图)
plt.xlim() / plt.ylim()设置坐标轴范围plt.xlim(0, 10); plt.ylim(0, 20)
plt.grid()添加网格线plt.grid(True, linestyle='--')(虚线网格)

http://www.dtcms.com/a/466386.html

相关文章:

  • 【课堂笔记】稳定性和反向传播误差
  • 网站刷链接怎么做ui设计师是吃青春饭吗
  • Vue3大文件上传终极解决方案
  • 球极平面投影
  • Linux进程信号 --- 信号的产生方式、信号的保存
  • 织梦建站教程全集以net结尾的网站
  • C语言入门(九):二维数组的介绍
  • 深圳网站设计公司的seo优化的常用手法
  • 西安三桥网站建设重庆市建设考试报名网站
  • Unicode编码中的零宽空格0x200B
  • 实战指南:Stable Diffusion 图像生成模型
  • PyTorch的AI框架小白入门的学习点
  • 办公网站模板网站建设微信官网开发
  • 信誉好的合肥网站建设全网网站建设维护
  • 建设部网站 标准下载如何判断网站做的关键词
  • 诺奖相关的调节性T细胞怎么养?
  • 旺道网站优化重庆ppt制作
  • ps免抠素材网站大全免费制作h5页面平台
  • 反激电源实际设计
  • Java优雅停机指南
  • DDoS攻击演变趋势与企业应对策略
  • 新版本 python 3.14 性能到底如何?
  • 郑州网站推广平台一个外国人做的破解游戏网站
  • 合肥网站建设方案咨询wordpress本地搭建网站a
  • .net电子商务网站开发wordpress展示图片不显示
  • 射频技术领域的领航者,昂瑞微IPO即将上会审议
  • VonaJS AOP编程:全局中间件全攻略
  • 物联网技术第四节课学习笔记
  • 【MT6631】MT6631 WiFi跑流ping包延迟大问题解决方案
  • 一个网站做两种产品文创产品