当前位置：首页 > news >正文

知识表示与处理4

news 2025/9/30 14:07:53

相关特征、无关特征、冗余

定义：从M中选择N个特征，准则函数可以达到最优解

搜索过程+选择准则

搜索过程：实践上，非穷举方法，找到次优解

循序向前选择法SFS

选最好的单个特征，从其他特征与它组合选最好的，直到达到特征数

缺点：单个特征去分离差，两个特这个结合区分力强，此时SFS失效

循序向后选择法SBS

一个一个去掉，也是贪心

选择准则：判断某个特征子集是否优于另一个，有监督或是无监督

1训练好分类器后的泛化误差

2定义类内距离度量来描述某个特征子集的可分度

类内距离：

1.类内散度

设有c个类别，Di表示第i个样本集，

m为每个类的类中心

2.均方距离

降维问题

不同的训练目标：PCA，LDA，LLR...

PCA主成分分析

多变量问题

PCA前提假设，数据符合正态分布；若分布为均匀或是圆则失效

二维中为椭圆，投影到长轴这边，分布好区分；四维中有四个轴，也是选最长的轴

若坐标系与椭圆的长短轴平行，那么长轴描述了数据的主要变化

但一般不平行

矩阵的旋转变换，矩阵相乘

缺点：无监督，无法处理实时数据

LDA线性判别分析

PCA两个类有重叠部分无法区分

LDA，类间区分

每个类计算协方差矩阵

基本瑞利商 xAX 大于最小特征值，小于最大特征值

基本瑞利商-广义瑞利商（有B）

不同点：LDA为有监督降维方法，最多只能降到（类别数-1）维

LDA 的目标是：最大化类间散度（between-class scatter）的同时最小化类内散度（within-class scatter）

在数学上，这等价于求解广义特征值问题：

关键点在于：类间散度矩阵 SB 的秩最多为 C−1

LLE局部线性嵌入

假设在小的局部是线性的，可以由周围的几个点线性表示，需要学习权重系数

低维空间中的投影，依然保持如何的权重关系

学习w，每个样本都有一个权重，损失函数：

在低维，用相同的w，损失函数为 sum(yi-sum_k(wyj))

流形正则项 J(Y) = tr(YMY)

对于图，图中 L+||WMW||2 ,其中M为邻接矩阵

查看全文

http://www.dtcms.com/a/424504.html

网站的搜索引擎方案wordpress实例站

【AI4S】大语言模型与化学的未来，以及整合外部工具和聊天机器人的潜力

网站视频转码软件wordpress 图片本地化

优秀的 API 接口设计规范

营销网站占用多少m空间深圳电子政务网站建设方案

品牌网站建设服务商济南百度网站开发

用 Python 实现一个简化但可运行的单点登录（SSO）系统

水果成篮-越短越合法

外国人做的购物网站做网站开发要具备哪些素质

印尼雅加达综合指数(JCI)数据对接实战指南

福州网站开发公司哪些网站可以做平面设计

临安规划建设局网站wordpress 评论按钮

定向广播扬声器：高速公路预警新利器为安全“喊话”

做网站送优化如何做授权网站

产品展示类网站网站用户体验度

网站管理问题建站点的步骤

安阳网站哪家做的好网站开发需要什么基础知识

新乡定制网站建设公司网站建设属于

网站建设技术和销售工资用手机建网站

网站集群建设方案中国移动积分兑换商城官方网站

怎么选择镇江网站建设WordPress影视cms

网站建设的一般流程排序为湖南城乡建设部网站

大数据数据质量校验实战指南：从0.3%差异率到滴水不漏的核对体系

阜阳哪里做网站的多购物网站开发技术

OpenCASCADE 点云拟合曲线与曲面：从零实现到工业级应用

【Axure教程】多角色登录原型

深圳德网站建设安装wordpress报错

port default vlan vlan-id 概念及题目

分布式任务调度系统设计方案

惠州网站建设企业廊坊网站专业制作

相关文章：