当前位置: 首页 > news >正文

【Python】Pandas

要求:

        Pandas是基于Numpy开发出的,专门用于数据分析的开源Python库

        Series(一维数据)

        DataFrame(多特征数据,既有行索引,又有列索引)

        DataFrame的属性

        

        Panda数据读取(以csv为例)

        pandas.read_csv(filepath_or_buffer, sep=",", names=None, usecols = None)

        filepath_or_buffer : 文件路径(本地路径或url路径) sep: 分隔符 names: 列索引的名字 usecols: 指定读取的列名 返回的类型: DataFrame

        Dataframe通过布尔索引过滤数据

代码实现:

1、通过numpy数组创建

import pandas as pd 
import numpy as np
print(pd.Series(np.arange(4,10)))

2、通过python数组创建

import pandas as pd
import numpy as npprint(pd.Series([11,12,14],index = ["北京","上海","深圳"]))

3、通过python字典创建

import pandas as pd
import numpy as npprint(pd.Series({"北京":11,"上海":12,"深圳":14}))

4、允许索引重复

import pandas as pd
import numpy as npa = pd.Series([11,12,14],index=["北京","上海","上海"])
a["上海"]
print(a)

5、

DataFrame(多特征数据,既有行索引,又有列索引)

import pandas as pd
import numpy as npdata_3_4 = pd.DataFrame(np.arange(10,22).reshape(3,4))
print(data_3_4)
print(data_3_4[:1])
print(data_3_4[:][0])

6、DataFrame的属性

import pandas as pd
import numpy as npresult = pd.read_csv("C:/工作簿.csv",encoding='gbk')
print(result.shape)
print(result.dtypes)
print(result.ndim)
print(result.index)
print(result.columns)
print(result.values)print("-->前5个:")
print(result.head(5))
print("-->后5个:")
print(result.tail(5))
print("-->描述信息:")
print(result.describe())

7、Panda数据读取(以csv为例)

import pandas as pd
import numpy as npresult = pd.read_csv("C:/工作簿.csv",encoding='gbk')
print(result)
print(result["姓名"][0:6])
print("读取后返回的类型为-->",type(result))

8、Dataframe通过布尔索引过滤数据

import pandas as pd 
import numpy as npresult = pd.read_csv("C:/工作簿.csv",encoding='gbk')
print(result[result["age"]>23])

9、

import pandas as pd
import numpy as npIMDB_1000 = pd.read_csv("C:/IMDB-Movie-Data.csv")
#print(IMDB_1000.dtypes)
#print(IMDB_1000.sort_values(by = "Rating",ascending=False))
#print(IMDB_1000[IMDB_1000["Runtime (Minutes)"]==IMDB_1000["Runtime (Minutes)"].max()])
#print(IMDB_1000[IMDB_1000["Runtime (Minutes)"]==IMDB_1000["Runtime (Minutes)"].min()])
#print(IMDB_1000["Runtime (Minutes)"].mean())
IMDB_1000.dropna()
IMDB_1000.fillna("NaN")
IMDB_1000["Revenue (Millions)"].fillna(IMDB_1000["Revenue (Millions)"].mean(),inplace=True)
IMDB_1000

运行结果:

 1、通过numpy数组创建

2、通过python数组创建

3、通过python字典创建

4、允许索引重复

5、

DataFrame(多特征数据,既有行索引,又有列索引)

6、DataFrame的属性

7、Panda数据读取(以csv为例)

8、Dataframe通过布尔索引过滤数据

9、

http://www.dtcms.com/a/287831.html

相关文章:

  • rustdesk客户端编译
  • QT窗口(7)-QColorDiag
  • 根据ARM手册,分析ARM架构中,原子操作的软硬件实现的底层原理
  • tailscale在ubuntu22.04上使用
  • Unity物理响应函数与触发器
  • LVS详解
  • GitHub 趋势日报 (2025年07月18日)
  • 【图像处理基石】什么是小波变换?
  • CAN总线负载率计算及示例说明
  • 【CVPR2025】计算机视觉|RORem:让物体移除“脱胎换骨”!
  • Streamlit 官翻 2 - 开发指南 Develop Concepts
  • 昇思+香橙派 AI 开发实践:DeepSeek 全流程指南(基于 openEuler)
  • lesson18:Python函数的闭包与装饰器(难)
  • TypeScript 泛型详解:从基础到实战应用
  • 3.条件判断:让程序学会做选择
  • Web开发 03
  • import.meta.glob 与 import.meta.env、import的几个概念的简单回顾
  • react+antd+表格拖拽排序以及上移、下移、移到顶部、移到底部
  • 408数据结构强化(自用)
  • 实现el-select下拉框,下拉时加载数据
  • MYSQL 第一次作业
  • 《命令行参数与环境变量:从使用到原理的全方位解析》
  • Flink实时流量统计:基于窗口函数与Redis Sink的每小时PV监控系统(学习记录)
  • UniApp 自定义导航栏:解决安全区域适配问题的完整实践
  • C++基于muduo库从零实现Rpc框架
  • Ubuntu18.04环境下,vscode使用clangd、bear实时准确跳转过程中遇到的compile_commands.json无法解析问题
  • windows wsl ubuntu 如何安装 maven
  • 程序混淆的可行性?
  • PyCharm 入门指南:起步学习、开发环境一体
  • java: DDD using sql server 2019 or Oracle21c