当前位置: 首页 > news >正文

pandas Dataframe介绍以及创建

简介

  • DataFrame 是 Pandas 中最常用的二维数据结构,可以看作是带有行索引和列标签的二维数组,类似于电子表格或 SQL 表。
  • pandas:
    • series 一维数据 行
      • 值1 值2 值3 值4
      • 一维数据结构很难表示 对应的数据
    • DataFrame 二维数据 行 列
      • 二维数据结构:每一行表示一条记录,每一个列表示一个字段
      • 有行索引和列标签:
        • 行索引表示每一行
        • 列标签表示每一列
  • DataFrame 定义数据的格式:
{
	"列标签1"["值1""值2""值3",.....],
	"列标签2"["值1""值2""值3",.....],
	"列标签3"["值1""值2""值3",.....]
}

创建数据 字典嵌套列表格式

# 字典嵌套列表
# 引用
import pandas as pd
# 定义字典 二维
dist = {
    "name":['张三','李四','王五'],
    "age":[13, 34, 56],
    "sex":['男','女','男']
}
# 创建DataFrame
df = pd.DataFrame(dist)
# 输出
print(df)

结果:
  name  age sex
0   张三   131   李四   342   王五   56

列表嵌套列表

  • 这种方式需要自己定义列标题
# 列表嵌套列表

# 引用
import pandas as pd

# 定义数据 
data = [
    ['张三','男',18],
    ['李四','男',28],
    ['王五','女',38],
]
# 定义列标题
columns = ['name','age','sex']
# 创建 DataFrame
df = pd.DataFrame(data,columns = columns)
# 输出
print(df)

结果:
  name age  sex
0   张三   男   18
1   李四   男   28
2   王五   女   38

列表里嵌套字典

  • 就是在列表中的值是字典

  • [
    	{键1;值1,键2:值2}
    ]
    
    # 列表里嵌套字典
    # 引用pandas
    import pandas as pd
    # 定义 数据
    data = [
        {'name':'zhang','age':18,'sex':'man'},
        {'name':'li','age':28,'sex':'woman'},
        {'name':'wang','age':38,'sex':'man'},
    ]
    # 创建DataFrame
    df = pd.DataFrame(data)
    # 输出
    print(df)
    
    结果:
        name  age    sex
    0  zhang   18    man
    1     li   28  woman
    2   wang   38    man
    

使用Numpy定义数组

  • 如果需要使用Numpy ,必须先安装 在终端中写入pip install Numpy安装,并 引用 引用方式与pandas一样

  • Numpypython 中的数值计算库,可以提供一个数组和多维数据的定义,和各种数组处理工具

  • 使用Numpy 创建数组:

    • 一维数组:

    • # Numpy
      
      # 引用Numpy
      import numpy as np
      # 定义一维数组
      arr1 = np.array([1,2,3,4])
      # 输出
      print(arr1)
      
      结果;
      [1 2 3 4]
      
    • 二维数组

    • # 二维数组
      arr2 = np.array(
          [   [1,2,3,4],
              [2,3,4,5],
              [3,4,5,6]
          ]
      )
      # 输出
      print(arr2)
      
      结果:
      [[1 2 3 4]
       [2 3 4 5]
       [3 4 5 6]]
      
  • 创建DataFrame

    • # 引用pandas
      import pandas as pd
      # 创建 DataFrame
      df = pd.DataFrame(arr2,columns = ['a','b','c','d'])
      # 输出
      print(df)
      
      结果;
         a  b  c  d
      0  1  2  3  4
      1  2  3  4  5
      2  3  4  5  6
      

相关文章:

  • 使用 Python 调用 Ollama API 并调用 deepseek-r1:8b 模型
  • 【量化科普】Liquidity,流动性
  • 鸟语林-论坛系统自动化测试
  • 【网络安全 | 漏洞挖掘】账户接管+PII+原漏洞绕过
  • 【语音科学计算器】当前汇率
  • Python简单使用MinerU
  • 学习Linux准备2
  • 深入理解设计模式之解释器模式
  • 如何设计app测试用例
  • Docker下的Elastic search
  • 使用 LS-DYNA 光滑粒子流体动力学 (SPH) 进行搅拌摩擦焊接
  • 【CXX】3 其它Rust与C++互操作工具详解
  • 网页请求腾讯云环境的云函数
  • 【算法】直接插入排序、折半插入排序、希尔排序
  • 【JAVA】封装多线程实现
  • 【WebGL】fbo双pass案例
  • 《AI与NLP:开启元宇宙社交互动新纪元》
  • ue5地面上出现preview字样
  • 服务可用性评价指标
  • 第二届粤港澳大湾区数字经济与人工智能国际学术会议(DEAI 2025)
  • 85后清华博士黄佐财任湖北咸宁市咸安区委副书记、代区长
  • 专访|高圆圆:像鸟儿一样,柔弱也自由
  • 习近平抵达莫斯科伏努科沃专机机场发表书面讲话(全文)
  • 【社论】三个“靠谱”为市场注入确定性
  • 我国外汇储备规模连续17个月稳定在3.2万亿美元以上
  • “半世纪来对无争议边界最深入袭击”:印巴冲突何以至此又如何收场?