当前位置: 首页 > wzjs >正文

如何做介绍一门课程的网站做数据可视化的网站

如何做介绍一门课程的网站,做数据可视化的网站,国外营销型网站,手机网站 扁平化趋势1.1 Pandas概述 核心概念: Pandas 是基于 NumPy 的数据分析库,核心数据结构:Series(一维)和 DataFrame(二维)。 应用场景:数据清洗、转换、统计分析、时间序列处理。 特点&#x…

1.1 Pandas概述

  • 核心概念

    • Pandas 是基于 NumPy 的数据分析库,核心数据结构:Series(一维)和 DataFrame(二维)。

    • 应用场景:数据清洗、转换、统计分析、时间序列处理。

  • 特点

    • 支持异构数据、缺失值处理、灵活的数据对齐。


1.2 Pandas基本操作

  • 数据读写

    df = pd.read_csv('data.csv')       # 读取 CSV
    df.to_excel('output.xlsx')        # 写入 Excel
  • 数据查看

    df.head(5)      # 前5行
    df.info()       # 数据结构
    df.describe()   # 统计摘要
  • 数据选取

    df['column']    # 单列
    df[['col1', 'col2']]  # 多列

1.3 Pandas索引

  • 索引类型

    • 行索引:df.index(默认 RangeIndex)

    • 列索引:df.columns

  • 设置索引

    df.set_index('date', inplace=True)  # 指定列为索引
    df.reset_index()                    # 重置索引
  • 多层索引(MultiIndex):

    df = df.set_index(['year', 'month'])  # 分层索引

1.4 groupby操作

  • 基础分组聚合

    df.groupby('category')['price'].mean()  # 按类别分组计算均价
  • 多级分组

    df.groupby(['year', 'month']).sum()
  • 自定义聚合函数

    def range_agg(x):return x.max() - x.min()
    df.groupby('group').agg(range_agg)

1.5-1.7 数值运算与对象操作

  • 数值运算

    df['col'].sum() / df['col'].cumsum()  # 累加和
    df.apply(np.sqrt)                     # 应用函数
  • 字符串操作(需转换为 str 类型):

    df['name'].str.upper()                # 转大写
    df['email'].str.contains('@gmail')    # 匹配子串
  • 对象类型处理

    df['col'].astype('category')          # 转换为分类类型

1.8 merge操作

  • 表连接

    pd.merge(left, right, on='key', how='inner')  # 内连接

  • 参数详解

    • howleftrightouterinner

    • suffixes: 解决列名冲突(如 _x_y


1.9 显示设置

  • 调整显示选项

    pd.set_option('display.max_rows', 100)   # 最多显示100行
    pd.set_option('display.float_format', '{:.2f}'.format)  # 浮点数格式

1.10 数据透视表

  • 快速汇总

    pd.pivot_table(df, values='sales', index='region', columns='year', aggfunc=np.sum)
  • 多层透视

    pd.pivot_table(df, index=['region', 'year'], values='sales', aggfunc=[np.mean, np.sum])

1.11-1.12 时间操作

  • 时间解析

    df['date'] = pd.to_datetime(df['date'])  # 转为时间类型
    df['year'] = df['date'].dt.year         # 提取年份
  • 时间序列重采样

    df.resample('M').mean()                 # 按月重采样
    1.13-1.14 Pandas常用操作
  • 去重与排序

    df.drop_duplicates(subset='col')        # 去重
    df.sort_values(by='col', ascending=False)  # 排序
  • 缺失值处理

    df.dropna()                             # 删除缺失值
    df.fillna(method='ffill')               # 前向填充

1.15 Groupby操作延伸

  • 分组后过滤

    df.groupby('group').filter(lambda x: x['value'].mean() > 10)  # 筛选组
  • 分组应用自定义函数

    def normalize(x):return (x - x.mean()) / x.std()
    df.groupby('group').apply(normalize)

1.16 字符串操作

  • 正则匹配

    df['text'].str.extract(r'(\d+)')        # 提取数字
    df['text'].str.replace(r'\d+', 'NUM')   # 替换数字
    1.17 索引进阶
  • 条件筛选

    df.query('age > 30 & salary > 5000')    # 查询语法
    df.loc[df['age'] > 30, 'name']          # 标签定位
    索引优化:

        

df = df.sort_index()                    # 索引排序提升查询速度

1.18 Pandas绘图操作

  • 集成 Matplotlib

    df.plot(x='date', y='price', kind='line')  # 折线图
    df['sales'].plot.hist(bins=20)           # 直方图

1.19 大数据处理技巧

  • 分块读取

    chunk_iter = pd.read_csv('large.csv', chunksize=10000)  # 分块读取
    for chunk in chunk_iter:process(chunk)
  • 内存优化

    df = df.astype({'col1': 'int32', 'col2': 'category'})  # 降低内存占用
  • 并行处理

    import swifter
    df['new_col'] = df['col'].swifter.apply(lambda x: x*2)  # 利用多核加速
    总结
  • 核心数据结构Series 和 DataFrame 是 Pandas 的基石。

  • 数据操作四要素索引分组合并清洗

  • 性能优化:类型转换、分块处理、并行计算。

  • 实战场景:金融数据分析、日志处理、时间序列预测。


文章转载自:

http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://00000000.hLnrj.cn
http://www.dtcms.com/wzjs/604754.html

相关文章:

  • 12306网站 花了多少钱建设嵌入式软件开发待遇
  • 网站建设的系统设计wordpress html模板下载
  • 怎么做百度自己的网站做一个购物网站价格
  • 哪里有网站制作建设天津市建设工程定额网站
  • 郑州视频网站建设大概多少钱建平台需要投资多少钱
  • 青岛即墨网站建设合理规划网站
  • 做分享衣服网站的初衷是什么意思wordpress去掉底部版权
  • 隆回网站建设制作企业网站的建设包括
  • 科技公司网站制作公司管理咨询合同
  • wordpress网站特别卡杭州酒店网站设计公司推荐
  • 高端设计图网站外贸网站建设需要什么
  • 无锡网站制作哪家好wordpress 主題
  • 网站信息组织优化wordpress写文章失败
  • 二道网站建设手机和网站页面模板
  • 沈阳网站建设设计报价网站建设客网站
  • 网站建设规划论文农特产品网站建设合同模板
  • 如何在网站上做公示合肥经开区网络推广的公司
  • 网站推广有哪些举措爱站网注册人查询
  • 网站建设的收费企业网站主页模板
  • 大学生兼职网网站建设计划书成都建设二维码网站
  • 上海哪家做网站关键词排名百度淘宝网
  • 威海城乡和住房建设局网站江门鹤山最新消息新闻
  • 高端网站服务范围微信获客crm平台
  • 国产做的视频网站wordpress 免费 博客主题
  • 学习网站制作汽车网站设计论文
  • 可以自己做网站网络产品及其推广方法
  • 免费下载软件的网站有哪些常州做网站麦策电商
  • 邢台建设专业网站万网科技
  • 深圳平台网站建设外包网站销售如何做业绩
  • 天津设计网站建设网站设计规划表答案