当前位置: 首页 > wzjs >正文

目前较流行的网站开发框架网站建设与管理常用

目前较流行的网站开发框架,网站建设与管理常用,wordpress 微信支付插件下载,移动建站平台有哪些对数变换 和Box-Cox变换 变换的目的 就是让数据分布更适合建模,减少偏态和异常值带来的负面影响,从而提升模型的表现和稳定性。准备工作 确保要处理的数据的值都大于 0 。在这之前,可以统计对应列的最值print(df.min(), df.max()),观察是否有< 0 的值,有的话,就必须先…

对数变换 和Box-Cox变换

变换的目的
  • 就是让数据分布更适合建模,减少偏态和异常值带来的负面影响,从而提升模型的表现和稳定性。
准备工作
  • 确保要处理的数据的值都大于 0 。
  • 在这之前,可以统计对应列的最值print(df.min(), df.max()),观察是否有< 0 的值,有的话,就必须先处理,再做后续变换
  • 示例代码如下:
def reset_zero(x):  return max(x,0)  
# 先给这两列的值,确保大于0,再进行对数转换或者Box-Cox转换  
features['Garage spaces']=features['Garage spaces'].apply(lambda x: reset_zero(x))  
features['Total spaces']=features['Total spaces'].apply(lambda x: reset_zero(x))
对数变换log和boxcox变换的联系
  • log1p(x) 实际上是 Box-Cox 变换的特殊情况(λ=0),
    • log1p(x) == boxcox1p(x, λ=0)
  • Box-Cox 变换通过调节 λ,可以在 log1p 和其他幂次变换之间自适应选择,使数据分布更接近正态分布。
  • 所以 Box-Cox 更灵活,能自动适应不同特征的分布;而 log1p 只是 λ=0 的情况。

对数变换 – np.log / np.log1p

  • 🧨🧨🧨注意内容:
    • log1p 对应 +1,如果需要,求逆的时候还要 -1;
  1. 观察法:直观的方式:
    数值比较大,且不同样本之间的数据变化也比较大【下面给出个具体例子】
print(train_features.min(), train_features.max())  # 应在一个合理范围内  
print(train_labels.min(), train_labels.max())# 调整前
# tensor(0) tensor(72993.2)
# tensor(0) tensor(18100053)# 调整后
# tensor(-15.2072) tensor(72.9932)
# tensor(11.5179) tensor(18.3153)
"""
  1. 更科学一点的方法:一般是要结合数据的特性来使用,比如这里使用偏度(skewness)
    • |skewness| < 0.5:分布近似对称(无需处理)
    • 0.5 ≤ |skewness| < 1:中等偏斜(可考虑处理)
    • |skewness| ≥ 1:高度偏斜(建议处理)
    • 综上,对于>0.5 就可以使用这个了
    • 举例子:根据下面的输出的head(20) 来查看数据的偏度,决定是否使用
# 选取 features 数据集中所有数值型(int64 和 float64)列的列名  
numerical_columns = features.select_dtypes(include=['int64','float64']).columns  # 对每个数值型特征计算偏度(skewness),即分布的不对称程度。  
# stats.skew(x) 计算偏度,偏度越大,分布越偏斜。  
# 结果按偏度从大到小排序。  
skewed_features = features[numerical_columns].apply(lambda x: stats.skew(x)).sort_values(ascending=False)  
skewness = pd.DataFrame({'Skew value' :skewed_features})  
# 展示偏度最大的前20个特征。  
skewness.head(20)
使用方法

y = np.log1p(y) 等价于 y =np.log(1 + y)

import numpy as np
import pandas as pdtrain_data = pd.read_csv("train.csv")
# train_data["Sold Price"] = np.log(train_data["Sold Price"]+1) 
train_data["Sold Price"] = np.log1p(train_data["Sold Price"]) # 求原数值
train_data["Sold Price"] = np.exp(train_data["Sold Price"]) - 1
逆变换
import numpy as np# 生成示例数据
np.random.seed(0)
original_data = [0.5, 1.0

文章转载自:

http://7WFQMpbH.nrLsg.cn
http://fQ9So5Xx.nrLsg.cn
http://IjuH4E7d.nrLsg.cn
http://5UFeueyB.nrLsg.cn
http://gJkQyYrb.nrLsg.cn
http://AFZicCno.nrLsg.cn
http://KkFy76lh.nrLsg.cn
http://cx8Fso9d.nrLsg.cn
http://NeESqAfD.nrLsg.cn
http://l5JA9Nng.nrLsg.cn
http://A09Id0gc.nrLsg.cn
http://5ReT6nVA.nrLsg.cn
http://kYxBZ1tu.nrLsg.cn
http://8MFKB7lX.nrLsg.cn
http://TnPUYlqD.nrLsg.cn
http://vRGeZb7m.nrLsg.cn
http://65v8hcBX.nrLsg.cn
http://kMJ2VQX2.nrLsg.cn
http://I7S8fZhS.nrLsg.cn
http://6R0Xpslq.nrLsg.cn
http://h1JFDesK.nrLsg.cn
http://DFBxZFEZ.nrLsg.cn
http://Zs07geYb.nrLsg.cn
http://0S00Bf0b.nrLsg.cn
http://daNjJFej.nrLsg.cn
http://O1wywgL4.nrLsg.cn
http://lqUquzZu.nrLsg.cn
http://ZUMMTPP7.nrLsg.cn
http://NvJr5noY.nrLsg.cn
http://UoWbvKJV.nrLsg.cn
http://www.dtcms.com/wzjs/764649.html

相关文章:

  • 用php做网站的方法发布悬赏任务的推广平台
  • 网站整站下载器下载utf8网页乱码做网站找外包好吗
  • 建设网站用户名遵义微商城网站建设平台
  • 网站建设必须在服务器廊坊北京网站建设
  • 建筑建设规范网站城市中国商业网站平台
  • 网站定位案例企业的vi设计都包括哪几种
  • 网站域名的建立app软件开发技术
  • 快速网站推广首页排名短视频seo
  • 做网站的机构免费技能培训在哪里报名
  • 手机网站开发报价单在线代理网址
  • 肇庆制作网站软件成都网站建设四易维达
  • 单招网站开发石家庄搭建网站
  • 百度舆情系统seo关键词排名优化推荐
  • 苏州做企业网站的公司爱网站站长工具
  • 站长之家ip查询工具专门做加盟的网站
  • html网站开发开题报告范文咖啡店网站模板
  • 制作自己网站有什么软件高性能网站建设指南 当当
  • 主机做网站湖北建设
  • 天津重型网站建设方案公司软文是什么意思
  • 专门做养老院的网站安徽专业网站建设设计
  • 湖南营销型网站建设 皆来磐石网络专业团队的优势
  • vs网站制作训做网站的心得体会范文
  • 热度网络网站建设百度联盟
  • 大学生做网站主题佛山网站推广 优帮云
  • php外贸网站模板故事型软文广告
  • 基层科普网站建设的现状工程承包合作协议书
  • 建大型网站企业网站建设开发服务
  • 禅城技术支持骏域网站建设百度榜单
  • 网站开发兼职群去外包公司的利与弊
  • 进网站显示建设中怎么解决北京市e窗口工商登记