【Pandas】pandas DataFrame
Pandas2.2 DataFrame
Constructor
|方法|描述|
|DataFrame([data, index, columns, dtype, copy])|用于创建二维表格数据结构的主要构造函数|
pandas.DataFrame
pandas.DataFrame
是 Pandas 库中用于创建二维表格数据结构的主要构造函数。它可以接受多种类型的数据输入,并提供丰富的参数来控制 DataFrame 的创建过程。
参数说明
data
:必需,可以是以下几种形式之一:- 一维或二维的 NumPy 数组、列表或字典。
- 另一个 DataFrame 或 Series。
- 结构化数组或记录数组。
- 字典的列表。
- 其他可迭代对象。
index
:可选,指定行索引标签,默认为从 0 开始的整数序列。columns
:可选,指定列标签,默认为从 0 开始的整数序列。dtype
:可选,指定数据类型,应用于所有元素。copy
:可选,布尔值,指定是否复制数据,默认为False
。
示例及结果
以下是 pandas.DataFrame
的几种常见用法示例及其结果。
-
从字典创建 DataFrame
import pandas as pd # 创建一个字典 data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago'] } # 创建 DataFrame df = pd.DataFrame(data) print("DataFrame from dictionary:\n", df)
结果:
DataFrame from dictionary: Name Age City 0 Alice 25 New York 1 Bob 30 Los Angeles 2 Charlie 35 Chicago
-
从列表创建 DataFrame
import pandas as pd # 创建一个列表 data = [ ['Alice', 25, 'New York'], ['Bob', 30, 'Los Angeles'], ['Charlie', 35, 'Chicago'] ] # 创建 DataFrame df = pd.DataFrame(data, columns=['Name', 'Age', 'City']) print("DataFrame from list:\n", df)
结果:
DataFrame from list: Name Age City 0 Alice 25 New York 1 Bob 30 Los Angeles 2 Charlie 35 Chicago
-
从 NumPy 数组创建 DataFrame
import pandas as pd import numpy as np # 创建一个 NumPy 数组 data = np.array([ ['Alice', 25, 'New York'], ['Bob', 30, 'Los Angeles'], ['Charlie', 35, 'Chicago'] ]) # 创建 DataFrame df = pd.DataFrame(data, columns=['Name', 'Age', 'City']) print("DataFrame from NumPy array:\n", df)
结果:
DataFrame from NumPy array: Name Age City 0 Alice 25 New York 1 Bob 30 Los Angeles 2 Charlie 35 Chicago
-
指定行索引和列标签
import pandas as pd # 创建一个字典 data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago'] } # 指定行索引 index = ['A', 'B', 'C'] # 指定列标签 columns = ['Name', 'Age', 'City'] # 创建 DataFrame df = pd.DataFrame(data, index=index, columns=columns) print("DataFrame with specified index and columns:\n", df)
结果:
DataFrame with specified index and columns: Name Age City A Alice 25 New York B Bob 30 Los Angeles C Charlie 35 Chicago
-
复制数据
import pandas as pd # 创建一个字典 data = { 'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35], 'City': ['New York', 'Los Angeles', 'Chicago'] } # 创建 DataFrame 并复制数据 df = pd.DataFrame(data, copy=True) print("DataFrame with copied data:\n", df)
结果:
DataFrame with copied data: Name Age City 0 Alice 25 New York 1 Bob 30 Los Angeles 2 Charlie 35 Chicago
通过这些示例,可以看到 pandas.DataFrame
构造函数如何灵活地从不同类型的数据源创建 DataFrame,并支持多种参数来控制其行为。这使得数据处理和分析变得更加方便和高效。