当前位置: 首页 > news >正文

Python中使用pandas

使用Pandas进行数据处理和分析

Pandas是Python中最流行的数据处理和分析库之一。下面我将介绍Pandas的基本使用方法。

安装Pandas

pip install pandas

基本数据结构

1. Series - 一维数组

import pandas as pd# 创建Series
s = pd.Series([1, 3, 5, 7, 9])
print(s)

2. DataFrame - 二维表格

# 创建DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'],'Age': [25, 30, 35],'City': ['New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
print(df)

数据读取与写入

读取CSV文件

df = pd.read_csv('data.csv')

写入CSV文件

df.to_csv('output.csv', index=False)

读取Excel文件

df = pd.read_excel('data.xlsx', sheet_name='Sheet1')

写入Excel文件

df.to_excel('output.xlsx', sheet_name='Sheet1', index=False)

数据查看与选择

查看数据

df.head()      # 查看前5行
df.tail(3)     # 查看后3行
df.info()      # 查看数据信息
df.describe()  # 统计摘要

选择数据

# 选择列
df['Name']       # 选择单列
df[['Name', 'Age']]  # 选择多列# 选择行
df.iloc[0]       # 按位置选择第一行
df.loc[0]        # 按索引选择
df[df['Age'] > 30]  # 条件选择

数据操作

添加/删除列

# 添加列
df['Salary'] = [50000, 60000, 70000]# 删除列
df = df.drop('City', axis=1)

排序

df.sort_values('Age', ascending=False)

分组聚合

df.groupby('City')['Age'].mean()

处理缺失值

df.dropna()      # 删除缺失值
df.fillna(0)     # 填充缺失值

数据合并

# 连接两个DataFrame
df1 = pd.DataFrame({'A': ['A0', 'A1'], 'B': ['B0', 'B1']})
df2 = pd.DataFrame({'A': ['A2', 'A3'], 'B': ['B2', 'B3']})
result = pd.concat([df1, df2])

时间序列处理

# 创建时间序列
dates = pd.date_range('20230101', periods=6)
df = pd.DataFrame({'Date': dates, 'Value': [1, 2, 3, 4, 5, 6]})# 设置日期为索引
df.set_index('Date', inplace=True)# 按时间筛选
df['2023-01-01':'2023-01-03']

这只是Pandas功能的冰山一角。Pandas还提供了许多高级功能,如数据透视表、窗口函数、数据可视化集成等。


文章转载自:

http://nsu2AS6T.qqkLk.cn
http://WYKM75Fl.qqkLk.cn
http://IsfhmzVW.qqkLk.cn
http://7DFZrKis.qqkLk.cn
http://mMAbJAnh.qqkLk.cn
http://iv0l4HL6.qqkLk.cn
http://UdvfGiAF.qqkLk.cn
http://qfalvM0N.qqkLk.cn
http://c3IIdlNA.qqkLk.cn
http://ohMzItPI.qqkLk.cn
http://IKjmAwdt.qqkLk.cn
http://zmcK6nN2.qqkLk.cn
http://KS97NR2m.qqkLk.cn
http://i2LFgMue.qqkLk.cn
http://oVI9CVI7.qqkLk.cn
http://UHcZoJGo.qqkLk.cn
http://FmO3n1YN.qqkLk.cn
http://bib8tMJf.qqkLk.cn
http://FQaPuewc.qqkLk.cn
http://7jPqiaA2.qqkLk.cn
http://r8bbLC9o.qqkLk.cn
http://BavI8JEg.qqkLk.cn
http://k6bAhwEC.qqkLk.cn
http://efeFiAui.qqkLk.cn
http://Vs3Fwy2i.qqkLk.cn
http://L2Fm3L5z.qqkLk.cn
http://TPuzGovF.qqkLk.cn
http://xEpKu194.qqkLk.cn
http://HAkjdleo.qqkLk.cn
http://3jBB9lUK.qqkLk.cn
http://www.dtcms.com/a/227474.html

相关文章:

  • P5684 [CSP-J2019 江西] 非回文串 题解
  • 使命召唤16:现代战争 MOD整合包 豪华中文 免安 离线运行版
  • MySQL指令个人笔记
  • Vue 项目创建教程 (开发前的准备工作保姆级辅助文档)
  • 2018ToG | 可逆的灰度图像
  • 数据库三范式的理解
  • Java中Random类常用方法详解
  • 界面分析 - 上
  • 风控研发大数据学习路线
  • DAX权威指南6:DAX 高级概念(扩展表)、DAX 计算常见优化
  • 我的LGB模型的一些参数和说明
  • 从“人防”到“智防”,智驱力助力危化品企业智能化转型
  • #16 学习日志软件测试
  • bismark OT CTOT OB CTOB 以及mapping后的bam文件中的XG,XR列的含义
  • Python基础:人生重开模拟器(小游戏)
  • 2024年数维杯国际大学生数学建模挑战赛C题时间信号脉冲定时噪声抑制与大气时延抑制模型解题全过程论文及程序
  • CUDA与OpenGL混合编程图形渲染
  • vLLM实战部署embedding、reranker、senseVoice、qwen2.5、qwen3模型
  • [蓝桥杯]约瑟夫环
  • Qt/C++编写GB28181服务端工具/绿色版开箱即用/对标wvp-gb28181/实时画面预览/录像回放下载
  • 5.29 自学测试 Linux基础 Day4
  • 基于大模型的急性乳腺炎全病程风险预测与综合治疗方案研究
  • 快乐大冒险:解锁身体里的 “快乐密码”
  • 海外tk抓包简单暴力方式
  • 如何评估 RAG 的分块Chunking策略
  • node-sass 报错
  • 小云天气APP:精准预报,贴心服务
  • 《P2960 [USACO09OCT] Invasion of the Milkweed G》
  • 悲观锁与乐观锁:并发编程中的两种核心控制策略详解
  • 洋流的实时原位预测