当前位置: 首页 > news >正文

神经网络八股(2)

1.数据增强算法

基于样本变换的数据增强:旋转,翻转,缩放,裁剪,噪声添加,色彩调整(亮度,对比度)

混合数据增强方法:mixup(两张图像按照一定混合成一幅图像),cutmix(从A图像随机裁剪一小块放到B图像中,进行直c接覆盖),Cutout方法(随机删除图像中的某一部分)

2.如何解决正负样本不均衡的问题

负样本不均衡是指在数据集中,不同类别的样本数量存在显著差异的现象。

数据方面:增加少样本数目

模型方面:修改损失函数,使用带有权重的损失函数

评估指标:免使用准确率作为唯一指标,改用精确率、召回率,F1分数更全面的指标

精确率:测为正样本的样本中,实际为正样本的比例

召回率:实际为正样本的样本中,模型正确预测为正样本的比例

F1分数:精确率和召回率的调和平均数

3.小目标检测是目标检测的痛难点,如何解决?

数据增强:增多样本数,调整图像分辨率,增加数据多样性

特征提取:多尺度多级特征提取,注意力机制

损失函数优化;无锚点检测,迁移学习

4.opencv中都有哪些边缘检测算子

索贝尔算子(sobel):通过卷积核在水平和垂直方向上分别求取一阶导数,从而突出显示图像中的边界

拉普拉斯算子:二阶微分算子,用于检测图像中的边缘

canny边缘检测:高斯滤波去除噪声;梯度计算使用Sobel算子计算梯度幅值和方向;非极大值抑制保留局部最大梯度值,双阈值检测通过高低阈值确定最终的边缘

5.深度可分离卷积:

将传统的卷积操作分解为两个独立的步骤——深度卷积和逐点卷积

深度卷积:对输入特征图的每个通道独立进行卷积操作。每个输入通道使用一个独立的卷积核,不与其他通道共享权重

逐点卷积:使用1x1的卷积核对深度卷积的输出进行卷积操作,目的是将不同通道的特征进行融合

6.常用的插值方法

插值方法是一种数学技术,用于根据已知数据点生成新的数据点。

最近邻插值:选择最近的已知数据点作为插值结果。对于图像缩放,最近邻插值会将目标像素的值设置为最近的源像素值。

  • 不会引入新的像素值,因此不会模糊图像。

  • 但可能导致图像出现明显的锯齿效应。

  • 对速度要求高且对图像质量要求不高的场景

双线性插值:通过计算目标点周围4个最近邻点的加权平均值来确定插值结果。权重与距离成反比

7.高斯滤波器的原理

只要是滤波,都有自己的卷积核,卷积核内有自己的权重参数,在图像中滑动时和图像对应的像素进行相乘,而卷积核内的权重参数分布就符合高斯函数分布,中间高两边低。

8.目标检测中的map计算

map就是多个类别的pr曲线之和的平均值,P就是精确值,R就是召回率

9.AP和mAP的区别?

ap是坐标系PR曲线下的微分面积,m是多个类别的平均

10.输入多尺度的图像怎么给图像做到统一输出

图像缩放,图像填充,图像裁剪(大图像随机裁剪成小图像),图像金字塔(FPN)多尺度融合

相关文章:

  • 为啥vue3设计不直接用toRefs,而是reactive+toRefs
  • 10、k8s对外服务之ingress
  • [数据结构]单链表详解
  • 【核心算法篇十六】《DeepSeek强化学习:MuZero算法核心解析》
  • 用大内存主机下载Visual Studio
  • day17-后端Web原理——SpringBoot原理
  • 解决 LeetCode 串联所有单词的子串问题
  • Python迭代器知多少
  • Java 语言线程池的原理结构
  • 蓝桥杯备考:递归初阶
  • Ollama 下载模型的默认存储位置修改
  • HTML5+CSS多层级ol标签序号样式问题
  • ASUS/华硕无畏16 X1605VA 原厂Win11 22H2系统 工厂文件 带ASUS Recovery恢复
  • 《ArkTS详解:鸿蒙生态中的高效开发语言》
  • 滑动窗口:解决最小覆盖子串问题
  • 本地部署DeepSeek R1 + 界面可视化open-webui【ollama容器+open-webui容器】
  • 3dmax运动捕捉
  • elasticsearch在windows上的配置
  • 感想-人工智能:AI 的优缺点 / AI是一把好的锄头,但它永远不能自己去种地
  • 【我要成为配环境高手】node卸载与nvm安装
  • 西安建设工程信息网是谁开发的/360优化大师官网
  • 做网站的公司地址/深圳全网推广
  • 个人网站建设流程/seo优化的内容有哪些
  • 芷江建设局网站/长沙seo培训
  • 东莞专业网站建设公司/最近新闻
  • 网站访问密码/北京网站推广服务