当前位置: 首页 > news >正文

Sklearn 机器学习 数值标准化

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

Sklearn 机器学习:数值标准化实战指南(含 CSV 读取与训练测试处理)

在机器学习中,特征的数值标准化(Normalization/Standardization) 是模型训练前非常重要的预处理步骤,尤其在使用如 SVM、KNN、逻辑回归等对特征尺度敏感的算法时更是关键。

💡 术语说明:在实际使用中,NormalizationStandardization 虽常被混用,但两者含义略有不同:

  • Standardization 指将数据转换为标准正态分布(均值为0,标准差为1);
  • Normalization 通常指将数据缩放到特定区间(如 [0,1]);

本文统一使用“数值标准化”泛指特征尺度调整的所有方法,具体方法将在文中分别说明。


📌 一、什么是数值标准化?

数值标准化是将特征数据缩放到统一的尺度上,常见方法包括:

  • Z-score 标准化(StandardScaler)
    将每一维特征转换为均值为 0,标准差为 1 的分布:

    z = x − μ σ z = \frac{x - \mu}{\sigma} z=σxμ

    其中 $\mu$ 为特征均值,$\sigma$ 为标准差。

  • 最小-最大缩放(MinMaxScaler)
    将特征压缩到指定区间(如 [0, 1]):

    x ′ = x − x min ⁡ x max ⁡ − x min ⁡ x' = \frac{x - x_{\min}}{x_{\max} - x_{\min}} x

http://www.dtcms.com/a/295311.html

相关文章:

  • 变量和函数底层工作原理
  • Mysql常用武功招式
  • 大脑各脑区功能解析:从痛觉处理到动作执行的协作机制
  • runc源码解读(一)——runc create
  • 技术赋能与体验升级:高端网站建设的核心要义
  • 【VSCode】复制到下一行快捷键
  • SparkSQL 子查询 IN/NOT IN 对 NULL 值的处理
  • 【分布式锁】什么是分布式锁?分布式锁的作用?
  • Windows计算器项目全流程案例:从需求到架构到实现
  • 宝塔通过docker部署JupyterHub指南【常见错误处理】
  • 深入解析文件操作(下)- 文件的(顺序/随机)读写,文件缓冲区,更新文件
  • 【AI】Jupyterlab中数据集的位置和程序和Pycharm中的区别
  • 20-ospf技术
  • MIT线性代数01_方程组的几何解释
  • 绿色转向的时代红利:创新新材如何以技术与标准主导全球铝业低碳重构
  • 旅行短视频模糊的常见原因及应对方法
  • 内网穿透:打破网络限制的利器,内外网概念、穿透原理、实际操作方法步骤
  • 【LeetCode 热题 100】39. 组合总和——(解法一)选或不选
  • 【物联网】基于树莓派的物联网开发【16】——树莓派GPIO控制LED灯实验
  • 暑期算法训练.7
  • 97.2%灵敏度,桐树基因MSI NGS 2249 Panel——低肿瘤含量MSI检测的王者
  • CIRL:因果启发的表征学习框架——从域泛化到奖励分解的因果革命
  • LLM:Day1
  • 【Linux】linux基础开发工具(一) 软件包管理器yum、编辑器vim使用与相关命令
  • Web前端:JavaScript some()迭代方法
  • 前端如何利用多通道发布(MCP)打造高效AI驱动应用?
  • Hadoop磁盘I/O瓶颈的监控与优化:从iostat指标到JBOD vs RAID的深度解析
  • 2025真实面试试题分析-iOS客户端开发
  • Spring工程中集成多个redis数据源
  • iOS WebView 加载失败与缓存刷新问题排查实战指南