当前位置: 首页 > news >正文

神经网络八股(2)

1.数据增强算法

基于样本变换的数据增强:旋转,翻转,缩放,裁剪,噪声添加,色彩调整(亮度,对比度)

混合数据增强方法:mixup(两张图像按照一定混合成一幅图像),cutmix(从A图像随机裁剪一小块放到B图像中,进行直c接覆盖),Cutout方法(随机删除图像中的某一部分)

2.如何解决正负样本不均衡的问题

负样本不均衡是指在数据集中,不同类别的样本数量存在显著差异的现象。

数据方面:增加少样本数目

模型方面:修改损失函数,使用带有权重的损失函数

评估指标:免使用准确率作为唯一指标,改用精确率、召回率,F1分数更全面的指标

精确率:测为正样本的样本中,实际为正样本的比例

召回率:实际为正样本的样本中,模型正确预测为正样本的比例

F1分数:精确率和召回率的调和平均数

3.小目标检测是目标检测的痛难点,如何解决?

数据增强:增多样本数,调整图像分辨率,增加数据多样性

特征提取:多尺度多级特征提取,注意力机制

损失函数优化;无锚点检测,迁移学习

4.opencv中都有哪些边缘检测算子

索贝尔算子(sobel):通过卷积核在水平和垂直方向上分别求取一阶导数,从而突出显示图像中的边界

拉普拉斯算子:二阶微分算子,用于检测图像中的边缘

canny边缘检测:高斯滤波去除噪声;梯度计算使用Sobel算子计算梯度幅值和方向;非极大值抑制保留局部最大梯度值,双阈值检测通过高低阈值确定最终的边缘

5.深度可分离卷积:

将传统的卷积操作分解为两个独立的步骤——深度卷积和逐点卷积

深度卷积:对输入特征图的每个通道独立进行卷积操作。每个输入通道使用一个独立的卷积核,不与其他通道共享权重

逐点卷积:使用1x1的卷积核对深度卷积的输出进行卷积操作,目的是将不同通道的特征进行融合

6.常用的插值方法

插值方法是一种数学技术,用于根据已知数据点生成新的数据点。

最近邻插值:选择最近的已知数据点作为插值结果。对于图像缩放,最近邻插值会将目标像素的值设置为最近的源像素值。

  • 不会引入新的像素值,因此不会模糊图像。

  • 但可能导致图像出现明显的锯齿效应。

  • 对速度要求高且对图像质量要求不高的场景

双线性插值:通过计算目标点周围4个最近邻点的加权平均值来确定插值结果。权重与距离成反比

7.高斯滤波器的原理

只要是滤波,都有自己的卷积核,卷积核内有自己的权重参数,在图像中滑动时和图像对应的像素进行相乘,而卷积核内的权重参数分布就符合高斯函数分布,中间高两边低。

8.目标检测中的map计算

map就是多个类别的pr曲线之和的平均值,P就是精确值,R就是召回率

9.AP和mAP的区别?

ap是坐标系PR曲线下的微分面积,m是多个类别的平均

10.输入多尺度的图像怎么给图像做到统一输出

图像缩放,图像填充,图像裁剪(大图像随机裁剪成小图像),图像金字塔(FPN)多尺度融合


文章转载自:

http://Nlgd9dWB.kjyhh.cn
http://Gb40XHXs.kjyhh.cn
http://etMIkxap.kjyhh.cn
http://NXPIRN4G.kjyhh.cn
http://1cnBl9tT.kjyhh.cn
http://7J8HzO5Q.kjyhh.cn
http://pGNzXXOO.kjyhh.cn
http://XTqUKYjn.kjyhh.cn
http://EVgeFkMj.kjyhh.cn
http://l9ZkFzAQ.kjyhh.cn
http://h38WLA0w.kjyhh.cn
http://xE3EgzIO.kjyhh.cn
http://jvWN4M5k.kjyhh.cn
http://DnNH0FKr.kjyhh.cn
http://tN0JTTuk.kjyhh.cn
http://4Hbo7PVd.kjyhh.cn
http://IgPMtLgt.kjyhh.cn
http://5PB5308d.kjyhh.cn
http://vIu03lCt.kjyhh.cn
http://TzO78m4S.kjyhh.cn
http://P0wBgetU.kjyhh.cn
http://CPVCWaKI.kjyhh.cn
http://zcEZBTwz.kjyhh.cn
http://jRUXfz6y.kjyhh.cn
http://LkVmkxBs.kjyhh.cn
http://Pah8WtOA.kjyhh.cn
http://yOdrXkRw.kjyhh.cn
http://wRyuEFJc.kjyhh.cn
http://1cobBIIo.kjyhh.cn
http://GjlP33Zs.kjyhh.cn
http://www.dtcms.com/a/28747.html

相关文章:

  • 为啥vue3设计不直接用toRefs,而是reactive+toRefs
  • 10、k8s对外服务之ingress
  • [数据结构]单链表详解
  • 【核心算法篇十六】《DeepSeek强化学习:MuZero算法核心解析》
  • 用大内存主机下载Visual Studio
  • day17-后端Web原理——SpringBoot原理
  • 解决 LeetCode 串联所有单词的子串问题
  • Python迭代器知多少
  • Java 语言线程池的原理结构
  • 蓝桥杯备考:递归初阶
  • Ollama 下载模型的默认存储位置修改
  • HTML5+CSS多层级ol标签序号样式问题
  • ASUS/华硕无畏16 X1605VA 原厂Win11 22H2系统 工厂文件 带ASUS Recovery恢复
  • 《ArkTS详解:鸿蒙生态中的高效开发语言》
  • 滑动窗口:解决最小覆盖子串问题
  • 本地部署DeepSeek R1 + 界面可视化open-webui【ollama容器+open-webui容器】
  • 3dmax运动捕捉
  • elasticsearch在windows上的配置
  • 感想-人工智能:AI 的优缺点 / AI是一把好的锄头,但它永远不能自己去种地
  • 【我要成为配环境高手】node卸载与nvm安装
  • SVN把英文换中文
  • IPoIB QP 初始化流程详解
  • 机器学习面试题汇总
  • 例题:求算法的时间复杂度
  • ollama stream“:True django如何返回数据
  • JS宏实例:数据透视工具的制作(四)
  • Nginx稳定版最新1.26.2源码包安装【保姆级教学】
  • L0G3000 Git 基础知识
  • 栈,优先级队列,map,set
  • Python——生成AIGC图像