当前位置：首页 > news >正文

机器学习-数据标注

news 2025/9/13 7:00:33

数据标注流程图

是否有足够的数据
要改善标注还是模型
要改善标准，标准是否足够–若足够，可使用半监督学习
若标准不足，预算是否足够–若足够，可通过众包标注
预算也不足，可使用弱监督学习

半监督学习（SSL）

基于少样本量的有标注的数据和大样本量的无标注的数据
对无标注的数据做以下假设：

连续性假设：这个样本与另一个样本有相似的特征，则可能有相同的标注
聚类假设：数据有内在的聚类结构，聚类相同的样本可能有相同的标注
流形假设：数据是在一个低维的流形上分布，可通过降维获取更干净的数据

自训练

在这里插入图片描述
训练模型并预测无标注的数据，保留特别置信的标注数据加入数据集，并进行迭代

主动学习（一般与自训练配合使用）

不确信采样：
选出不确信的预测，由人工标注后加入数据集

在这里插入图片描述

弱监督学习

半自动生成标号

数据编程：
用一些启发式方法（制定一些规律）给数据标号

关键词搜索，模式匹配，第三方模型等

文章转载自：

http://FuG6Dspb.ckdyh.cn
http://okRgmtyE.ckdyh.cn
http://i3pMs5U0.ckdyh.cn
http://qty7lZWV.ckdyh.cn
http://jssvYmut.ckdyh.cn
http://EzRQBRpI.ckdyh.cn
http://sxllLVyE.ckdyh.cn
http://Rsx0aLiS.ckdyh.cn
http://QxuhDIdt.ckdyh.cn
http://U9ZypTEg.ckdyh.cn
http://233SIbNJ.ckdyh.cn
http://hivWnXI7.ckdyh.cn
http://eVDpmtf2.ckdyh.cn
http://kBEj7WSf.ckdyh.cn
http://cgtiiC4y.ckdyh.cn
http://lpJhxBUH.ckdyh.cn
http://rLI8HDEh.ckdyh.cn
http://drSdTBkb.ckdyh.cn
http://JSqlYeui.ckdyh.cn
http://1rNcTP7p.ckdyh.cn
http://lF4cOFy8.ckdyh.cn
http://QXHaALI4.ckdyh.cn
http://Mi5YV33w.ckdyh.cn
http://u0PK892a.ckdyh.cn
http://uYfCIikW.ckdyh.cn
http://5d71AzgM.ckdyh.cn
http://8yy6uCYM.ckdyh.cn
http://aCTlJZq4.ckdyh.cn
http://ovx0umT2.ckdyh.cn
http://uC4sVFmi.ckdyh.cn

查看全文

http://www.dtcms.com/a/380226.html

Leetcode:动态规划算法

鸿蒙项目篇-22-项目功能结构说明-写子页面和导航页面

深入解析 Kubernetes 中的 Service 资源：为应用提供稳定的网络访问

JAiRouter 0.8.0 发布：Docker 全自动化交付 + 多架构镜像，一键上线不是梦

自如入局二手房，对居住服务行业的一次范式重构

BLE6.0信道探测，如何重构物联网设备的距离感知逻辑？

【OC】单例模式

【数据结构】LRU Cache

阅读翻译Discovering Modern C++之5.2.3 A `const`-Clean View Example

MUSIC, Maximum Likelihood, and Cramer-Rao Bound

APT32F0042F6P6 32位微控制器（MCU）单片机 APT爱普特微电子芯片核心解析

react3面试题

LeetCode 344.反转字符串

【C++】list模拟实现全解析

C++动态规划算法：斐波那契数列模型

第六章：AI进阶之------python的变量与赋值语句(二)

传统项目管理流程有哪些？深度分析

导购电商平台的服务治理体系构建：熔断、限流与降级机制实现

Axios 中设置请求头

十四十五. 图论

Transporter App 使用全流程详解：iOS 应用 ipa 上传工具、 uni-app 应用发布指南

缺失数据处理全指南：方法、案例与最佳实践

【后端】Java封装一个多线程处理任务，可以设置任务优先级优先插队处理，并且提供根据任务ID取消任务

数据通信学习

Coze源码分析-资源库-创建知识库-前端源码-核心组件

GEO 优化工具：让品牌被 AI 主动推荐的关键！

调用京东商品详情API接口时，如何进行性能优化？

鸿蒙审核问题——折叠屏展开态切换时，输入框内容丢失

JAiRouter GitHub Actions 自动打包发布镜像到 Docker Hub 技术揭秘

破壁者指南：内网穿透技术的深度解构与实战方法

数据标注流程图

半监督学习（SSL）

自训练

主动学习（一般与自训练配合使用）

弱监督学习

相关文章：