当前位置: 首页 > news >正文

z-score算法

z-score算法原理参考网址
https://blog.csdn.net/m0_59596937/article/details/128378641

具体实现代码如下:

import numpy as np

class ZScoreOutlierDetector:
    def __init__(self, threshold=3):
        """构造函数"""
        self.threshold = threshold  # Z-score阈值,默认为3
        self.x_mean = None          # X坐标的均值
        self.x_std = None           # X坐标的标准差
        self.y_mean = None          # Y坐标的均值
        self.y_std = None           # Y坐标的标准差

    def fit(self, points):
        """根据样本数据计算各维度(x,y维度)的均值和标准差"""
        points = np.array(points)
        x = points[:, 0]#:表示选择所有行,0表示选择第0列(通常是x坐标)
        y = points[:, 1]
        self.x_mean = np.mean(x)
        self.x_std = np.std(x)
        self.y_mean = np.mean(y)
        self.y_std = np.std(y)

    def _calc_z_score(self, val, mean, std):
        """计算单个维度的Z-score,并且处理标准差为0的情况"""
        if std == 0:
            # 如果样本数据全相同,则当前值不同时视为无限大Z-score(即离群点)
            return float('inf') if val != mean else 0#python三元运算符
            #float('inf')表示无穷大
        return (val - mean) / std

    def is_outlier(self, point):
        """判断给定点是否为离群点"""
        x_z = self._calc_z_score(point[0], self.x_mean, self.x_std)
        y_z = self._calc_z_score(point[1], self.y_mean, self.y_std)
        # 任一维度超过阈值则视为离群点
        return abs(x_z) > self.threshold or abs(y_z) > self.threshold

# 示例用法
if __name__ == "__main__":
    # 样本数据
    sample_points = [
        (1.0, 2.0),
        (1.5, 3.0),
        (1.2, 2.5),
        (1.8, 3.2),
        (0.9, 2.1)
    ]

    # 初始化检测器并拟合数据
    detector = ZScoreOutlierDetector(threshold=3)
    detector.fit(sample_points)

    # 待检测点
    test_point = (5.0, 4.0)
    result = detector.is_outlier(test_point)

    print(f"检测点 {test_point} 是否为离群点:{result}")

相关文章:

  • expo应用,登录失败,页面自动刷新???----全局状态滥用导致的bug
  • sdut-C语言实验-二分查找
  • 学习笔记01——《深入理解Java虚拟机(第三版)》第二章
  • Android输入事件传递流程系统源码级解析
  • DeepSeek基础之机器学习
  • Spring AutoWired与Resource区别?
  • OpenHarmony构建系统-GN与子系统、部件、模块理论与实践
  • 新学一个JavaScript 的 classList API
  • 如何使用 JavaScript 模拟 Docker 中的 UnionFS 技术:从容器到文件系统的映射
  • 小波变换分解低频和高频
  • 从零开始学 Rust:基本概念——变量、数据类型、函数、控制流
  • RT-Thread+STM32L475VET6实现定时器定时功能
  • Transformer LLaMA
  • 基于SpringBoot的建筑工程项目管理系统
  • element ui的select选择框
  • 简单易懂,解析Go语言中的Slice切片
  • 【JavaEE进阶】数据库连接池
  • BFS算法解决最短路径问题(典型算法思想)—— OJ例题算法解析思路
  • Opengl常用缓冲对象功能介绍及使用示例(C++实现)
  • Qt中QRadioButton的使用
  • 西安机场回应航站楼“水帘洞”事件:屋面排水系统被冰雹堵塞
  • 新修订的《婚姻登记条例》明起施行,领证不用户口本了
  • 近4小时会谈、3项联合声明、20多份双边合作文本,中俄元首今年首次面对面会晤成果颇丰
  • 105岁八路军老战士、抗美援朝老战士谭克煜逝世
  • 一热就出汗 VS 热死都不出汗的人,哪个更健康?
  • 国家主席习近平同普京总统共见记者