当前位置: 首页 > news >正文

连续数据离散化与逆离散化策略

数学语言描述:

在区间[a,b]中有一组符合某分布的数据:

1.求相同区间中另一组符合同样分布的数据与这组数据的均方误差

2.求区间中点与数据的均方误差

3.求在区间中均匀分布的一组数据与这组数据的均方误差

一:同分布数据随机映射

假设在区间[a,b]上有两组数据,分别用随机变量X和Y表示,它们均独立且服从相同的概率分布:

求X和Y的MSE,即:

代入得

二:区间中值映射

令区间中点为

求X与m的MSE,即:

当随机变量X在区间[a,b]分布均匀且关于均值对称时有,此时:

三、均匀分布数据随机映射

已知

求X与Z的MSE,即

于是

若X的均值和均匀分布Z的均值相同

总结

综上在区间[a,b]有

在实际应用中应该考虑数据方差与区间宽度选择具体方案。一般来说,若提前对数据进行标准化则数据的均值为0,方差为1,则:

若仅考虑最优方案则可直接排除,即仅需要判断1与的大小关系。于是则选取方案一。

http://www.dtcms.com/a/114317.html

相关文章:

  • 学习笔记—C++—入门基础()
  • Qt之QHostInfo
  • 嵌入式AI的本地化部署的好处
  • 【51单片机】2-6【I/O口】【电动车简易防盗报警器实现】
  • 蓝桥云客--浓缩咖啡液
  • 前端精度计算:Decimal.js 基本用法与详解
  • VUE3组件综合应用(日历组件)
  • 8.5/Q1,Charls最新文章解读
  • stc8g1k08a定时读取内部1.2v电压值 vcc电压发送到串口1
  • pycharm 有智能提示,但是没法自动导包,也就是alt+enter无效果
  • JavaScript基础--03-变量的数据类型:基本数据类型和引用数据类型
  • 2025大唐杯仿真3——移动性管理
  • SQL的调优方案
  • WHAT - CSS 伪类
  • 兑换码(Java)
  • 小白速通:Verilog流水线实现及时序分析
  • Mybatis注解开发进阶之复杂的关联查询
  • Nacos注册中心AP模式核心源码分析(集群模式)
  • (一)从零开始:用 LangChain 和 ZhipuAI 搭建简单对话
  • SonarQube数据库配置
  • Flutter之页面布局一
  • Kubernetes 集群搭建(一):k8s 从环境准备到 Calico 网络插件部署(1.16版本)
  • 常见的图像生成算法
  • 堆与二叉树的关系
  • Python四大核心数据结构深度解析:列表、元组、字典与集合
  • STM32F103C8T6实现 SG90 360 °电机转动
  • 积分赛——获取环境温度
  • PyTorch深度学习框架60天进阶学习计划 - 第36天:医疗影像诊断(一)
  • Unhandled exception: org.apache.poi.openxml4j.exceptions.InvalidFormatException
  • 混合精度策略在PBiCGStab算法中的应用