当前位置: 首页 > wzjs >正文

uiapp博客 个人网站数字展厅设成都企业展厅设计公司

uiapp博客 个人网站,数字展厅设成都企业展厅设计公司,济宁做网站的公司,如何提高网站点击率怎么做复习: Series(一维)和 DataFrame(二维)是 Pandas 数据结构的两大核心,分别用于表示一维和二维的数据结构。它们非常适合处理结构化数据,尤其是时间序列和表格数据。下面详细介绍它们的定义、特…

复习:

`Series`(一维)和 `DataFrame`(二维)是 Pandas 数据结构的两大核心,分别用于表示一维和二维的数据结构。它们非常适合处理结构化数据,尤其是时间序列和表格数据。下面详细介绍它们的定义、特点和常见用法。

一. `Series`

`Series` 是 Pandas 中用于表示一维数据的对象,类似于一列数据或一个带标签的数组。`Series` 的每个数据点都有一个标签(索引)。

  1. 创建 `Series`

代码示例:

import pandas as pd

# 创建一个简单的Series

s = pd.Series([10, 20, 30, 40])

print(s)

输出:

0    10

1    20

2    30

3    40

dtype: int64

(2)Series` 的特点

- 一维数组,包含数据和索引。

- 索引可以是标签或数字,默认为0,1,2,3,……。

- 可以包含任何数据类型(整数、浮点数、字符串等)。

(3) Series` 的具体用法

1.自定义索引:

import pandas as pd

s = pd.Series([10, 20, 30], index=['a', 'b', 'c'])

print(s)

输出:

a    10

b    20

c    30

dtype: int64

  2.访问索引: 

# 通过索引访问数据

print(s['a'])  # 输出:10

# 通过位置访问数据

print(s.iloc[0])  # 输出:10

3.进行数学运算:

可以对 `Series` 进行加减乘除等运算,例如:

s = pd.Series([1, 2, 3])

print(s + 10)  # 每个元素加10

二. `DataFrame`

`DataFrame` 是 Pandas 中用于表示二维数据的对象类似于一个表格它由行和列组成,每一列都是一个 `Series`,并且每一行和每一列都有对应的索引。

(1)创建 `DataFrame`

# 通过字典创建 DataFrame

data = {

    'Name': ['Alice', 'Bob', 'Charlie'],

    'Age': [24, 27, 22],

    'Score': [88, 92, 95]

}

df = pd.DataFrame(data)

print(df)

输出:

      Name  Age  Score

0    Alice    24     88

1    Bob     27     92

2    Charlie  22     95

(2)`DataFrame` 的特点

- 表格型数据结构,有行和列。

- 每一列都是一个`Series`。

- 支持多种数据类型(每列可以是不同的数据类型)。

(3)`DataFrame` 的具体用法

  1. 选择数据:

选择一列数据,返回 `Series`:print(df['Name'])

选择多列数据,返回 `DataFrame`:print(df[['Name', 'Score']])

2.基于条件筛选:(数据分析重要操作)

# 筛选年龄大于23的数据

filtered_df = df[df['Age'] > 23]

print(filtered_df)

3.添加新列:(数据分析重要操作)

# 添加一列新的数据

df['Passed'] = df['Score'] > 90

print(df)

输出:

      Name  Age  Score  Passed

0     Alice   24     88    False

1     Bob    27     92    True

2    Charlie  22     95    True

4.删除行或列:

# 删除 "Age" 列

df = df.drop(columns=['Age'])

print(df)

# 删除第一行

df = df.drop(index=0)

print(df)

5.统计和汇总:(需要其他计算时,要自行学习)

# 计算平均值

print(df['Sc.mean())

# 描述统计信息ore']

print(df.describe())

6.数据透视表(Pivot Table):

#DataFrame` 提供了类似 Excel 的数据透视表功能,非常适合数据汇总和分析。

# 创建一个例子 DataFrame

data = {

    'Name': ['Alice', 'Bob', 'Alice', 'Bob'],

    'Subject': ['Math', 'Math', 'Science', 'Science'],

    'Score': [85, 90, 88, 95]

  }

df = pd.DataFrame(data)

# 创建数据透视表

pivot = df.pivot_table(values='Score', index='Name', columns='Subject')

print(pivot)

输出:

PS C:\Users\DELL\Desktop> python "D:\数据分析\# 创建一个例子 DataFrame.py"

Subject  Math  Science

Name

Alice    85.0     88.0

Bob      90.0     95.0

PS C:\Users\DELL\Desktop>

PS C:\Users\DELL\Desktop>

三.总结

Series:适合一维数据处理,例如单列数据。

DataFrame:适合二维数据处理,功能丰富,支持数据选择、条件筛选、数学运算、统计分析和数据透视表。

代码具体分析:

.dt

datetime类型的数据要先通过后缀.dt转化。只有在Series和DataFrame中,列索引筛选的数据进行格式转换时,才需要.dt

.dt是一个方便的接口,可以直接在Series对象中访问日期和时间的各个组成部分,便于日期时间数据的操作和分析。

import pandas as pd

df= pd.read_csv("/Users/time/电商数据.csv", usecols=[9,10])

df["create_time"] = pd.to_datetime(df["create_time"])

df["pay_time"] = pd.to_datetime(df["pay_time"])

df["create_time"] = df["create_time"].dt.strftime("%Y-%m")

df["pay_time"] = df["pay_time"].dt.strftime("%Y-%m")

print(df)

复习:.dt 的常见用法

假设我们有一个包含日期的 Series 数据:

  1. 提取日期信息

import pandas as pd

# 创建一个包含日期的 Series

dates = pd.Series(pd.to_datetime(['2024-01-01', '2024-02-15', '2024-03-30']))

# 提取年份

print(dates.dt.year)

# 提取月份

print(dates.dt.month)

# 提取季度

print(dates.dt.quarter)

  • 年份.dt.year
  • 月份.dt.month
  • .dt.day
  • 星期几.dt.dayofweek0=星期一, 6=星期日)
  • 季度.dt.quarter
2. 提取时间信息

如果 Series 包含时间部分,还可以使用 .dt 提取时间属性:

  • 小时.dt.hour
  • 分钟.dt.minute
  • .dt.second

# 创建包含日期和时间的 Series

times = pd.Series(pd.to_datetime(['2024-01-01 08:30:00', '2024-02-15 14:45:00', '2024-03-30 23:59:59']))

# 提取小时

print(times.dt.hour)

# 提取分钟

print(times.dt.minute)

3. 时间间隔计算

如果处理的是时间间隔数据类型 timedelta64.dt 提供以下属性:

  • 总秒数.dt.total_seconds()
  • 天数.dt.days
  • 小时.dt.components.hours

# 计算两个日期之间的差

date_diff = dates - dates.min()

print(date_diff.dt.days)  # 计算日期间隔的天数

strftime()

通过后缀.dt转化后,再通过strftime()函数转为字符串。

函数内传入的参数,是需要转换的指定格式。

df["create_time"] = pd.to_datetime(df["create_time"])

df["pay_time"] = pd.to_datetime(df["pay_time"])

df["create_time"] = df["create_time"].dt.strftime("%Y-%m")

df["pay_time"] = df["pay_time"].dt.strftime("%Y-%m")

print(df)

总结

1.pd.to_datetime() 是一个功能强大的工具,可以方便地将各种格式的数据转换为 Pandas 日期时间格式,使得日期时间处理更为简单。

2. `strftime()` 是用于格式化日期时间的函数,常见于 Python 的 `datetime` 模块。通过 `strftime()`,可以将 `datetime` 对象转换为自定义格式的字符串。


文章转载自:

http://otAvSl5Z.gbnns.cn
http://uETSQfyC.gbnns.cn
http://g4SvKOO6.gbnns.cn
http://0Vny3h6J.gbnns.cn
http://zNtvx0ff.gbnns.cn
http://r7GUqrc8.gbnns.cn
http://UuPZAP39.gbnns.cn
http://hf183YSI.gbnns.cn
http://V02AcAuc.gbnns.cn
http://uoocwCz6.gbnns.cn
http://jxKI0Xth.gbnns.cn
http://uk3VnFYT.gbnns.cn
http://H5A6v1XX.gbnns.cn
http://szf0Un4d.gbnns.cn
http://YDp8tdD2.gbnns.cn
http://40mg8Kfe.gbnns.cn
http://6a8FXC8P.gbnns.cn
http://rK98voSO.gbnns.cn
http://85j7BEj1.gbnns.cn
http://bJLiejuS.gbnns.cn
http://d6zQyHWn.gbnns.cn
http://3Tvw9jOY.gbnns.cn
http://EI1j1BzT.gbnns.cn
http://BpTw9gm4.gbnns.cn
http://V8TuFJA1.gbnns.cn
http://1nP3C9Ih.gbnns.cn
http://dsAeCoG2.gbnns.cn
http://fPpozLMW.gbnns.cn
http://aQ740bwM.gbnns.cn
http://qA5rmW3R.gbnns.cn
http://www.dtcms.com/wzjs/727324.html

相关文章:

  • 网站开发成本核算及账务处理无货源电商平台有哪些
  • 安庆怀宁网站建设兼职中国制造网外贸网官网登录入口
  • 网站建设公司效果在哪个网站做科目一考试题
  • 自适应微网站开发限时抢购网站源码
  • 网站源码检测涟水做网站
  • 自己做的网站被黑了怎么办中企动力邮箱企业版
  • 无人机东莞网站建设网站如何制作多少钱
  • 多网站管理网站推广流程
  • 慕课网站建设开题报告杭州做小程序软件的公司
  • 重庆金山建设监理有限公司网站烟台开发区网站制作公司
  • 门户网站开发维护合同今天郑州最新新闻
  • 网站建设资质备案seo网站搭建
  • 好模版网站建设网络道德教育网站的有效措施
  • 城乡住房和城乡建设部网站简单网上书店网站建设php
  • 网站推广的目的系统门户
  • 公司网站建设为什么不直接买模版wordpress选择模板没
  • 临沂建设局官方网站企业做网站能赚钱么
  • 用.net做的网站吗有建网站的软件
  • 永久免费手机网站建设教程外贸网络营销策划方案制定
  • 模板网站建设清单南昌做微信网站
  • 企业网站个人可以备案吗wordpress 添加ico
  • 绍兴市中等专业学校网站网站服务器租用的
  • 淘宝店铺不允许发布网站建设了新乡市网站建设有哪些公司
  • 做一个私人网站需要多少钱全国建设教育联盟统一平台网站
  • 如何做分享赚钱的网站百度一下首页百度
  • 做网站图片属性wordpress 白边
  • 深圳网站建设推荐q479185700顶上优秀设计案例作品
  • 郑州网站建设炉石校园网站平台建设
  • 合肥微网站做互助盘网站
  • 临沂做网站公司网页设计范文