当前位置: 首页 > wzjs >正文

相册模版网站图片展示滁州网站开发公司

相册模版网站图片展示,滁州网站开发公司,佛山专业建设网站平台,网站收录工具Pandas 中透视表(pivot_table)和交叉表(crosstab)的区别 核心区别 透视表 (pivot_table) 用于对数据进行 聚合计算(如求和、均值、计数等)。支持多维度分组(行、列、甚至多层索引)。…

Pandas 中透视表(pivot_table)和交叉表(crosstab)的区别

核心区别

  1. 透视表 (pivot_table)

    • 用于对数据进行 聚合计算(如求和、均值、计数等)。
    • 支持多维度分组(行、列、甚至多层索引)。
    • 可以指定 values(要聚合的值)和 aggfunc(聚合函数)。
  2. 交叉表 (crosstab)

    • 专门用于 计算频率分布(即列联表,统计不同组合的出现次数)。
    • 默认行为是计数,但也可通过参数自定义聚合函数。
    • 语法更简洁,适合快速生成两个变量的交叉统计。

代码示例与逐行注释

import pandas as pd
import numpy as np# 创建示例数据
data = {'区域': ['北区', '北区', '南区', '南区', '东区', '西区', '西区'],'产品类别': ['电子', '服装', '电子', '食品', '服装', '电子', '食品'],'销售额': [200, 150, 300, 80, 120, 250, 90],'季度': ['Q1', 'Q1', 'Q2', 'Q2', 'Q1', 'Q3', 'Q3']
}
df = pd.DataFrame(data)# 使用透视表 (pivot_table)
# 目标:按区域和产品类别汇总销售额总和
pivot = pd.pivot_table(df,values='销售额',     # 要聚合的数值列index='区域',        # 行分组键columns='产品类别',  # 列分组键aggfunc=np.sum,      # 聚合函数(默认是均值)fill_value=0         # 缺失值填充为0
)
print("透视表结果:")
print(pivot)# 使用交叉表 (crosstab)
# 目标:统计区域和产品类别的组合出现次数
crosstab = pd.crosstab(index=df['区域'],     # 行分类变量columns=df['产品类别'],  # 列分类变量margins=True,        # 显示总计margins_name='总计'   # 总计列的名称
)
print("\n交叉表结果:")
print(crosstab)# 交叉表进阶:结合销售额求和(自定义聚合)
crosstab_agg = pd.crosstab(index=df['区域'],columns=df['产品类别'],values=df['销售额'],  # 指定要聚合的值aggfunc=np.sum,       # 聚合函数dropna=False
)
print("\n交叉表(销售额求和):")
print(crosstab_agg)

输出结果解析

  1. 透视表输出
    按区域和产品类别对 销售额 进行求和:

    产品类别  电子  服装   食品
    区域                  
    东区     0  120    0
    北区   200  150    0
    南区   300    0   80
    西区   250    0   90
    
  2. 交叉表(默认计数)
    统计区域和产品类别的组合出现次数:

    产品类别  电子  服装  食品  总计
    区域                     
    东区      0    1    0    1
    北区      1    1    0    2
    南区      1    0    1    2
    西区      1    0    1    2
    总计      3    2    2    7
    
  3. 交叉表(销售额求和)
    按区域和产品类别对 销售额 求和:

    产品类别    电子    服装     食品
    区域                        
    东区       NaN  120.0    NaN
    北区     200.0  150.0    NaN
    南区     300.0    NaN   80.0
    西区     250.0    NaN   90.0
    

关键参数对比

功能透视表 (pivot_table)交叉表 (crosstab)
主要用途多维度聚合计算频率分布统计(列联表)
默认聚合均值 (aggfunc='mean')计数 (aggfunc='count')
多维支持支持多行、多列、多层索引通常用于两个变量的交叉
填充缺失值fill_value 参数无直接参数,可通过 dropna 控制显示
语法简洁性较复杂,需明确指定 valuesaggfunc更简洁,适合快速生成频率表

通过选择合适的方法,可以高效实现数据汇总或分布统计的需求!


文章转载自:

http://DxmLNUXI.ccpnz.cn
http://fSCCS5wI.ccpnz.cn
http://gtz8Rg60.ccpnz.cn
http://lJviYl0I.ccpnz.cn
http://mF2DYMb9.ccpnz.cn
http://G9SiWsc5.ccpnz.cn
http://mjdeCpvY.ccpnz.cn
http://5PSLL0C4.ccpnz.cn
http://fRpXMD8a.ccpnz.cn
http://gm2AQe7v.ccpnz.cn
http://DYq34xI1.ccpnz.cn
http://NzLmvshB.ccpnz.cn
http://uvgGk0as.ccpnz.cn
http://Kg1q2hTV.ccpnz.cn
http://6vhO6RvX.ccpnz.cn
http://JycoBOSM.ccpnz.cn
http://UVcwIfG3.ccpnz.cn
http://M31ICBVr.ccpnz.cn
http://qIZmpqgn.ccpnz.cn
http://yfsXio7T.ccpnz.cn
http://YRuQIuEg.ccpnz.cn
http://g26gIraB.ccpnz.cn
http://r8IpHgvE.ccpnz.cn
http://ArR1ZUvq.ccpnz.cn
http://TFvJqFd9.ccpnz.cn
http://6b4paC6X.ccpnz.cn
http://DVBHrAf5.ccpnz.cn
http://4XFpPdOR.ccpnz.cn
http://5x3WEqA5.ccpnz.cn
http://cCfEoRCj.ccpnz.cn
http://www.dtcms.com/wzjs/759837.html

相关文章:

  • 哪些是网站建设电子商务网站建设的要素
  • 不收费的企业查询网站wordpress 中文标签
  • 深圳哪里有网站建设自己做网站传视屏
  • 佛山市网站建设分站企业网站制作 火星科技
  • 做网站的空间和服务器吗iis .htaccess wordpress
  • 仿京东网站模板wordpress首页制作幻灯片
  • 做悬赏的网站1网站免费建站
  • 江门建站公司wordpress新窗口
  • 门户网站开发框架wordpress 菜单相册
  • 玻璃制品东莞网站建设网站开发零基础培训学校
  • 电子商务网站建设选修课威海百姓网免费发布信息网
  • 门户网站的建设与维护北京网站开发服务商
  • 黄石网站建设深圳龙华建设工程交易中心网站
  • 做网站前台需要学什么 后台wordpress如何自建站
  • 深圳做网站(信科网络)邢台中高风险地区
  • 做网站0基础写代码同城app开发价目表
  • 有关于网站建设的参考文献设计方案格式模板范文
  • 惠州学院网站建设网站设计模式
  • 程序员和网站开发宁波品牌网站设计价格
  • 阿里云企业网站建设教程优化网站关键词怎么做
  • 京东客网站怎么建设伪原创嵌入网站
  • 建筑网站的功能模块有哪些保定网站seo费用
  • 网站改版十长春广告公司网站建设
  • 旅游主题网站策划书上海建设摩托官方网站
  • 网站制作时如何分析竞争对手内蒙古城乡建设网站换名字了
  • 网站上设置多语言怎么做在哪网站开发软件
  • 朔州城市建设网站贵州省住房城乡建设厅网站
  • 旅游网站开发开题报告企业网站的搭建流程
  • 安徽津城建设工程有限公司网站山东高端网站设计
  • 深圳华强北手机城seo排名点击首页