当前位置: 首页 > news >正文

Min-Max标准化​ 和 ​Z-score标准化

1. 核心公式对比

标准化方法计算公式关键参数
Min-Max标准化

最小值、最大值
Z-score标准化

均值(μ)、标准差(σ)

2. 核心区别

​(1) 数据分布影响
维度Min-Max标准化Z-score标准化
输出范围固定到 [0, 1] 或自定义范围(如[-1,1])无固定范围(可能超出[-3,3])
极值敏感性对异常值敏感(极大/小值直接影响分母)对异常值鲁棒性强
分布形状保持原始分布形状转换为均值为0、标准差1的分布

示例​:
假设原始数据 [1, 2, 3, 100](100是异常值):

  • Min-Max结果:[0, 0.01, 0.02, 1](异常值导致其他数据被压缩接近0)
  • Z-score结果:[-0.68, -0.66, -0.64, 1.98](异常值影响较小)
​(2) 数学性质
性质Min-Max标准化Z-score标准化
均值无固定均值转换后均值=0
标准差无固定标准差转换后标准差=1
线性变换是(等比缩放+平移)是(平移+缩放)

3. 应用场景对比

场景推荐方法原因
图像处理(像素归一化)Min-Max需固定到[0,1]或[0,255]范围
机器学习(SVM、KNN)Min-Max基于距离的算法需要统一量纲
统计分析(假设检验)Z-score便于比较不同分布的数据(如考试分数与身高)
存在异常值的数据Z-score避免极值对标准化结果的扭曲
深度学习(神经网络输入)两者均可Min-Max更常见,但Z-score对ReLU激活函数更友好


5. 优缺点总结

方法优点缺点
Min-Max结果直观,范围固定受异常值影响大
Z-score保留数据分布特性,兼容异常值结果范围不固定,解释性稍弱

6. 如何选择?​

  • 选 ​Min-Max​ 如果:
    • 需要严格限定范围(如RGB像素值)
    • 数据分布均匀且无极端异常值
  • 选 ​Z-score​ 如果:
    • 数据存在潜在异常值
    • 需要与其他数据集进行分布比较(如不同单位的指标)

特殊技巧​:对异常值较多的数据,可先用IQR剔除异常值后再Min-Max标准化

http://www.dtcms.com/a/301795.html

相关文章:

  • MySQL - 索引(B+树)
  • IDEA安装Key Promoter X插件记录快捷键使用频率提高生产率
  • JavaWeb学习打卡17(监听器使用、Filter过滤器实现权限拦截案例)
  • 网络虚拟化:veth,bridge,network namespace与docker网络
  • JavaScript核心概念全解析
  • 基于CNN图像特征提取流程(简化版)
  • Python训练Day25
  • 深度学习(鱼书)day04--手写数字识别项目实战
  • RK3568 Linux驱动学习——U-Boot使用
  • Docker的docker-compose类比Spring的ApplicationContext
  • Yaffs文件系统学习
  • Mysql数据库基础(入门)
  • 智慧施工:施工流程可视化管理系统
  • 【分享】外国使馆雷电综合防护系统改造方案(一)
  • 自动出题与批改系统(数学题生成+OCR识别)
  • Vue入门到实战之第三篇【超基础】
  • 从 .NET Framework 到 .NET 8:跨平台融合史诗与生态演进全景
  • 数据科学专业的行业适配全景图
  • Unity TAA
  • 大数据工程师:职责与技能全景图 -- 从“数据搬运工”到“价值架构师”
  • 三、构建一个Agent
  • Triton IR
  • 【测试报告】思绪网(Java+Selenium+Jmeter自动化测试)
  • 力扣面试150题--二进制求和
  • 五度标调法调域统计分析工具
  • 【笔记】Einstein关系式 D = ukBT 的推导与应用研究
  • 零拷贝 详述
  • Day4.AndroidAudio初始化
  • Linux学习篇11——Linux软件包管理利器:RPM与YUM详解与实战指南,包含如何配置失效的YUM镜像地址
  • 【RH134 问答题】第 2 章 调度未来任务