当前位置: 首页 > news >正文

要导入StandardScaler类进行数据标准化,请使用以下语句:

要导入StandardScaler类进行数据标准化,请使用以下语句:

from sklearn.preprocessing import StandardScaler

使用步骤详解

  1. 创建实例
    scaler = StandardScaler()

  2. 拟合数据(计算均值和标准差)
    scaler.fit(X_train)
    说明:X_train是训练集特征矩阵,形状为(n_samples, n_features)

  3. 转换数据(应用标准化)

    X_train_std = scaler.transform(X_train)  # 标准化训练集
    X_test_std = scaler.transform(X_test)     # 用训练集的参数标准化测试集
    

关键特性

  • 标准化公式
    z=x−μσz = \frac{x - \mu}{\sigma}z=σxμ
    其中μ\muμ是均值,σ\sigmaσ是标准差。
  • 作用:将数据转换为均值为0、标准差为1的分布,消除量纲影响。
  • 注意事项:测试集必须使用训练集计算的μ\muμσ\sigmaσ,避免数据泄露。

示例代码

import numpy as np
from sklearn.preprocessing import StandardScaler# 生成示例数据(3个样本,2个特征)
data = np.array([[1.0, 2.0], [3.0, 1.0], [2.0, 3.0]])# 标准化
scaler = StandardScaler()
scaler.fit(data)                # 计算均值和标准差
transformed_data = scaler.transform(data)  # 应用转换print("原始数据:\n", data)
print("标准化后:\n", transformed_data)
print("均值:", scaler.mean_)     # 输出: [2.0, 2.0]
print("标准差:", np.sqrt(scaler.var_))  # 输出: [0.82, 0.82] (近似)

常见问题解答

Q: 为什么测试集要使用训练集的参数?
A: 确保生产环境中的数据与训练时采用相同的转换规则,避免模型偏差。

Q: 标准化和归一化(MinMaxScaler)的区别?
A: 标准化保留异常值信息,归一化将数据压缩到[0,1]区间。标准化更适用于服从高斯分布的数据。

http://www.dtcms.com/a/334538.html

相关文章:

  • JavaScript学习第十章-第三部分(dom)
  • B3865 [GESP202309 二级] 小杨的 X 字矩阵(举一反三)
  • C#计算阶乘程序改进
  • C# 元组的用法
  • Nona生命之树作品TRO突袭,冻结名单曝光
  • Vue2.x核心技术与实战(一)
  • 摩搭api 实现
  • 025 理解文件系统
  • 多机编队——(6)解决机器人跟踪过程中mpc控制转圈问题
  • 第四章 Linux实用操作
  • OpenJDK 17的C1和C2编译器实现中,方法返回前插入安全点(Safepoint Poll)的机制
  • 【LeetCode题解】LeetCode 35. 搜索插入位置
  • [Linux] Linux逻辑卷管理
  • 知识点汇总linuxC高级 -2系统命令压缩与链接
  • RK3568 NPU RKNN(三):RKNN-ToolKit2模型构建与推理
  • 【LeetCode】算法详解#13 ---回文链表
  • Vue 3.5重磅更新:响应式Props解构,让组件开发更简洁高效
  • [Linux] Linux交换空间管理 Linux系统启动原理
  • 慧穗云开放平台 CDK 开票对接
  • echart中x的0位置出现柱子宽度被裁掉一部分的问题
  • 技术日记2025年08月16日
  • 基于FPGA的实时图像处理系统(1)——SDRAM回环测试
  • python---异常处理
  • Redis知识整理
  • 【论文笔记】STORYWRITER: A Multi-Agent Framework for Long Story Generation
  • 云服务平台主流架构的相关知识体系剖析
  • ABM和强化学习-2015年全国大学生数学建模竞赛B题
  • 安卓11 12系统修改定制化_____修改系统 解锁system分区 去除data加密 自由删减系统应用
  • JetPack系列教程(七):Palette——让你的APP色彩“飞”起来!
  • sql链接的url中serverTimezone的作用