当前位置: 首页 > news >正文

深度学习、图像算法学习记录

深度学习加速

综述文档: https://chenzomi12.github.io/02Hardware01Foundation/02ArchSlim.html
winograd: https://zhuanlan.zhihu.com/p/260109670
ncnn

1.修改模型结构,优化模型内存访问次数,加速。
VGG 和 InceptionNet : 将5x5卷积替换成两个3x3卷积,既提升了网络深度,又减少了参数量.
MobileNet :深度可分离卷积,最后用1x1卷积组合,直接大量缩减模型参数量。
DenseNet 和 GhostNet :Reuse Feature Map,复用之前层的featureMap。

2.分布式训练
torch.nn.parallel.DistributedDataParallel: 在多个GPU复制一份模型副本,单独计算batch,计算完后,平均梯度值再广播到所有GPU,更新。

3.矩阵乘法(卷积转为矩阵乘法)

  • 多线程
  • 算法改进(Fast Fourier Transform、Strassen、Winograd)

知识蒸馏

1.自蒸馏:Be Your Own Teacher: Improve thePerformance of Convolutional Neural Networks viaSelf Distillation;

经典论文:

attention: https://arxiv.org/pdf/1706.03762
mobilenet系列
pix2pix
ALIKED

论文解读

ALIKED
1.结构?
4个block,通过1x1卷积+上采样组合所有block的特征,然后通过一个SMH (Score Map Head )得到Score Map,再通过DKD模块(NMS)得到特征点位置(64x64x128),同时得到对应点的描述子。

2.卷积无法保证提取到的点是仿射不变的?aliked中怎么解决该问题的?
答:因为卷积带有特定模式,比如检测横线的卷积,在特征图做仿射变换后变成非横线,卷积就检测不到了。

ATTENTION IS ALL YOU NEED
1.QKV结构,QKV是通过输入做Linear得到,Linear的权重为可学习参数;
2.通过QK点乘,得到对应的V的重要程度权重,再用权重与V乘,得到每个v加权后的注意力值;
3.QK点乘实际是计算的余弦相似度。

工具:

神经网络可视化工具(每一层输出的可视化,用以指导每层网络的设计是否合理):https://blog.51cto.com/u_16099181/8552104

Winograd

卷积运算转为矩阵乘法后,存在很多重复值,等效稀疏矩阵,比普通矩阵实际少很多计算量。

http://www.dtcms.com/a/121830.html

相关文章:

  • 【Proteus仿真】【32单片机-A009】矩阵按键系统设计
  • 代码随想录-动态规划24
  • 【Windows】Win2008服务器SQL服务监控重启脚本
  • golang gmp模型分析
  • 【Game】Powerful——Martial Arts Challenge(6)
  • 数据库实践题目:在线书店管理系统
  • 高性能服务开发利器:redis+lua
  • Spring 框架的核心基础:IoC 和 AOP
  • 【算法竞赛】回文字符串+思维模拟(蓝桥杯真题·回文字符串·代码清晰易懂)
  • 巧记英语四级单词 Unit3-上【晓艳老师版】
  • 【SpringCloud】从入门到精通(下)
  • TCP 与 UDP
  • Qt 开发时可以在函数内引用的头文件
  • 国网B接口协议调阅实时视频接口流程详解以及检索失败原因(电网B接口)
  • 蓝桥杯刷题总结 + 应赛技巧
  • MySQL表的增删查改(基础)
  • python学智能算法(九)|决策树深入理解
  • [前端]从人体结构看网页三要素:HTML、CSS 与 JavaScript
  • C#.NET模拟用户点击按钮button1.PerformClick自动化测试
  • 动手人形机器人(RL)
  • 去除Mysql表中的空格、回车、换行符和特殊字符
  • 淘宝API与小程序深度联动:商品详情页“一键转卖”功能开发
  • NO.83十六届蓝桥杯备战|动态规划-基础线性DP|台阶问题|最大子段和|传球游戏|乌龟棋(C++)
  • Elasticsearch 集群搭建
  • Vue3+Vite+TypeScript+Element Plus开发-10.多用户动态加载菜单
  • Hi Robot——大脑加强版的π0:基于「VLM的高层次推理+ VLA低层次任务执行」的复杂指令跟随及交互式反馈
  • Python标准库-copy
  • FairMOT复现过程中cython_bbox库问题
  • go游戏后端开发32:自摸杠处理逻辑
  • Elasticsearch中的基本全文搜索和过滤