当前位置: 首页 > news >正文

机器学习-数据标注

数据标注流程图

  1. 是否有足够的数据
  2. 要改善标注还是模型
  3. 要改善标准,标准是否足够–若足够,可使用半监督学习
  4. 若标准不足,预算是否足够–若足够,可通过众包标注
  5. 预算也不足,可使用弱监督学习

半监督学习(SSL)

基于少样本量的有标注的数据和大样本量的无标注的数据
对无标注的数据做以下假设:

  • 连续性假设:这个样本与另一个样本有相似的特征,则可能有相同的标注
  • 聚类假设:数据有内在的聚类结构,聚类相同的样本可能有相同的标注
  • 流形假设:数据是在一个低维的流形上分布,可通过降维获取更干净的数据

自训练

在这里插入图片描述
训练模型并预测无标注的数据,保留特别置信的标注数据加入数据集,并进行迭代

主动学习(一般与自训练配合使用)

不确信采样:
选出不确信的预测,由人工标注后加入数据集

在这里插入图片描述

弱监督学习

半自动生成标号

数据编程:
用一些启发式方法(制定一些规律)给数据标号

  • 关键词搜索,模式匹配,第三方模型等

文章转载自:

http://FuG6Dspb.ckdyh.cn
http://okRgmtyE.ckdyh.cn
http://i3pMs5U0.ckdyh.cn
http://qty7lZWV.ckdyh.cn
http://jssvYmut.ckdyh.cn
http://EzRQBRpI.ckdyh.cn
http://sxllLVyE.ckdyh.cn
http://Rsx0aLiS.ckdyh.cn
http://QxuhDIdt.ckdyh.cn
http://U9ZypTEg.ckdyh.cn
http://233SIbNJ.ckdyh.cn
http://hivWnXI7.ckdyh.cn
http://eVDpmtf2.ckdyh.cn
http://kBEj7WSf.ckdyh.cn
http://cgtiiC4y.ckdyh.cn
http://lpJhxBUH.ckdyh.cn
http://rLI8HDEh.ckdyh.cn
http://drSdTBkb.ckdyh.cn
http://JSqlYeui.ckdyh.cn
http://1rNcTP7p.ckdyh.cn
http://lF4cOFy8.ckdyh.cn
http://QXHaALI4.ckdyh.cn
http://Mi5YV33w.ckdyh.cn
http://u0PK892a.ckdyh.cn
http://uYfCIikW.ckdyh.cn
http://5d71AzgM.ckdyh.cn
http://8yy6uCYM.ckdyh.cn
http://aCTlJZq4.ckdyh.cn
http://ovx0umT2.ckdyh.cn
http://uC4sVFmi.ckdyh.cn
http://www.dtcms.com/a/380226.html

相关文章:

  • Leetcode:动态规划算法
  • 鸿蒙项目篇-22-项目功能结构说明-写子页面和导航页面
  • 深入解析 Kubernetes 中的 Service 资源:为应用提供稳定的网络访问
  • JAiRouter 0.8.0 发布:Docker 全自动化交付 + 多架构镜像,一键上线不是梦
  • 自如入局二手房,对居住服务行业的一次范式重构
  • BLE6.0信道探测,如何重构物联网设备的距离感知逻辑?
  • 【OC】单例模式
  • 【数据结构】LRU Cache
  • 阅读翻译Discovering Modern C++之5.2.3 A `const`-Clean View Example
  • MUSIC, Maximum Likelihood, and Cramer-Rao Bound
  • APT32F0042F6P6 32位微控制器(MCU)单片机 APT爱普特微电子 芯片核心解析
  • react3面试题
  • LeetCode 344.反转字符串
  • 【C++】list模拟实现全解析
  • C++动态规划算法:斐波那契数列模型
  • 第六章:AI进阶之------python的变量与赋值语句(二)
  • 传统项目管理流程有哪些?深度分析
  • 导购电商平台的服务治理体系构建:熔断、限流与降级机制实现
  • Axios 中设置请求头
  • 十四十五. 图论
  • Transporter App 使用全流程详解:iOS 应用 ipa 上传工具、 uni-app 应用发布指南
  • 缺失数据处理全指南:方法、案例与最佳实践
  • 【后端】Java封装一个多线程处理任务,可以设置任务优先级优先插队处理,并且提供根据任务ID取消任务
  • 数据通信学习
  • Coze源码分析-资源库-创建知识库-前端源码-核心组件
  • GEO 优化工具:让品牌被 AI 主动推荐的关键!
  • 调用京东商品详情API接口时,如何进行性能优化?
  • 鸿蒙审核问题——折叠屏展开态切换时,输入框内容丢失
  • JAiRouter GitHub Actions 自动打包发布镜像到 Docker Hub 技术揭秘
  • 破壁者指南:内网穿透技术的深度解构与实战方法