当前位置: 首页 > news >正文

建站模板建网站WordPress主题开源

建站模板建网站,WordPress主题开源,网上商店的特点,软装设计方案pptPandas 中透视表(pivot_table)和交叉表(crosstab)的区别 核心区别 透视表 (pivot_table) 用于对数据进行 聚合计算(如求和、均值、计数等)。支持多维度分组(行、列、甚至多层索引)。…

Pandas 中透视表(pivot_table)和交叉表(crosstab)的区别

核心区别

  1. 透视表 (pivot_table)

    • 用于对数据进行 聚合计算(如求和、均值、计数等)。
    • 支持多维度分组(行、列、甚至多层索引)。
    • 可以指定 values(要聚合的值)和 aggfunc(聚合函数)。
  2. 交叉表 (crosstab)

    • 专门用于 计算频率分布(即列联表,统计不同组合的出现次数)。
    • 默认行为是计数,但也可通过参数自定义聚合函数。
    • 语法更简洁,适合快速生成两个变量的交叉统计。

代码示例与逐行注释

import pandas as pd
import numpy as np# 创建示例数据
data = {'区域': ['北区', '北区', '南区', '南区', '东区', '西区', '西区'],'产品类别': ['电子', '服装', '电子', '食品', '服装', '电子', '食品'],'销售额': [200, 150, 300, 80, 120, 250, 90],'季度': ['Q1', 'Q1', 'Q2', 'Q2', 'Q1', 'Q3', 'Q3']
}
df = pd.DataFrame(data)# 使用透视表 (pivot_table)
# 目标:按区域和产品类别汇总销售额总和
pivot = pd.pivot_table(df,values='销售额',     # 要聚合的数值列index='区域',        # 行分组键columns='产品类别',  # 列分组键aggfunc=np.sum,      # 聚合函数(默认是均值)fill_value=0         # 缺失值填充为0
)
print("透视表结果:")
print(pivot)# 使用交叉表 (crosstab)
# 目标:统计区域和产品类别的组合出现次数
crosstab = pd.crosstab(index=df['区域'],     # 行分类变量columns=df['产品类别'],  # 列分类变量margins=True,        # 显示总计margins_name='总计'   # 总计列的名称
)
print("\n交叉表结果:")
print(crosstab)# 交叉表进阶:结合销售额求和(自定义聚合)
crosstab_agg = pd.crosstab(index=df['区域'],columns=df['产品类别'],values=df['销售额'],  # 指定要聚合的值aggfunc=np.sum,       # 聚合函数dropna=False
)
print("\n交叉表(销售额求和):")
print(crosstab_agg)

输出结果解析

  1. 透视表输出
    按区域和产品类别对 销售额 进行求和:

    产品类别  电子  服装   食品
    区域                  
    东区     0  120    0
    北区   200  150    0
    南区   300    0   80
    西区   250    0   90
    
  2. 交叉表(默认计数)
    统计区域和产品类别的组合出现次数:

    产品类别  电子  服装  食品  总计
    区域                     
    东区      0    1    0    1
    北区      1    1    0    2
    南区      1    0    1    2
    西区      1    0    1    2
    总计      3    2    2    7
    
  3. 交叉表(销售额求和)
    按区域和产品类别对 销售额 求和:

    产品类别    电子    服装     食品
    区域                        
    东区       NaN  120.0    NaN
    北区     200.0  150.0    NaN
    南区     300.0    NaN   80.0
    西区     250.0    NaN   90.0
    

关键参数对比

功能透视表 (pivot_table)交叉表 (crosstab)
主要用途多维度聚合计算频率分布统计(列联表)
默认聚合均值 (aggfunc='mean')计数 (aggfunc='count')
多维支持支持多行、多列、多层索引通常用于两个变量的交叉
填充缺失值fill_value 参数无直接参数,可通过 dropna 控制显示
语法简洁性较复杂,需明确指定 valuesaggfunc更简洁,适合快速生成频率表

通过选择合适的方法,可以高效实现数据汇总或分布统计的需求!

http://www.dtcms.com/a/484754.html

相关文章:

  • 公司网站主要功能阿里巴巴网站架构
  • 门户网站建设招投标企业logo设计免费生成器
  • 宜兴市城乡建设局网站合肥网站建设制作公司
  • 免费网站视频主持人访问国外网站好慢
  • 温州住房建设网站中国空间站和国际空间站对比
  • 网站开发所以浏览器兼容模式能浏览的海外网站
  • 徐州市云龙区建设局网站楚雄网站建设
  • 上海奉贤网站建设 列表网可以做旅行行程的网站
  • 政务中心网站自身建设能看wap软件
  • wordpress那个主题收录好包头seo优化
  • 门户网站开发 南宁广州企业建站网站
  • 做网站平台的公司建设网站 安全事项
  • 网站导入wordpress数字重庆公司
  • 网站搜索引擎优化吉安网站设计
  • 山西建设厅网站首页甘孜州住房和城乡规划建设局网站
  • 网站建设珠海网页设计教程读后感
  • uc投放广告网站要自己做吗用cn作网站行么
  • 怎么增加网站权重深圳网站建设 设计贝尔利
  • 无锡建设教育协会网站怎么破解网站后台密码
  • 凡科建站怎么保存网站用织梦做视频网站好不好
  • ios wordpress连接站点建湖网站建设找哪家好
  • 深圳网站建设公司排名塑料模板多少钱一平方
  • 英文建站模板下载app并安装到手机
  • 专业网站设计力荐亿企邦广州seo公司排行
  • 哈巴狗模式网站开发瑞丽网站建设
  • 济南seo整站优化厂家甘肃省省经合局网站建设的通知
  • 教做面点的网站怎么样学好网页设计
  • 徐州哪里做网站好国外最受欢迎的网站
  • 企业网站包含的要素网站开发怎么对接客户
  • 优化推广网站推荐张店网站制作设计公司