当前位置：首页 > news >正文

深度学习、图像算法学习记录

news 2025/10/21 10:03:01

深度学习加速

综述文档： https://chenzomi12.github.io/02Hardware01Foundation/02ArchSlim.html
winograd: https://zhuanlan.zhihu.com/p/260109670
ncnn

1.修改模型结构，优化模型内存访问次数，加速。
VGG 和 InceptionNet ： 将5x5卷积替换成两个3x3卷积，既提升了网络深度，又减少了参数量.
MobileNet :深度可分离卷积，最后用1x1卷积组合，直接大量缩减模型参数量。
DenseNet 和 GhostNet ：Reuse Feature Map，复用之前层的featureMap。

2.分布式训练
torch.nn.parallel.DistributedDataParallel： 在多个GPU复制一份模型副本，单独计算batch,计算完后，平均梯度值再广播到所有GPU，更新。

3.矩阵乘法（卷积转为矩阵乘法）

多线程
算法改进（Fast Fourier Transform、Strassen、Winograd）

知识蒸馏

1.自蒸馏：Be Your Own Teacher: Improve thePerformance of Convolutional Neural Networks viaSelf Distillation；

经典论文：

attention: https://arxiv.org/pdf/1706.03762
mobilenet系列
pix2pix
ALIKED

论文解读

ALIKED
1.结构？
4个block，通过1x1卷积+上采样组合所有block的特征，然后通过一个SMH (Score Map Head )得到Score Map，再通过DKD模块(NMS)得到特征点位置（64x64x128），同时得到对应点的描述子。

2.卷积无法保证提取到的点是仿射不变的?aliked中怎么解决该问题的？
答：因为卷积带有特定模式，比如检测横线的卷积，在特征图做仿射变换后变成非横线，卷积就检测不到了。

ATTENTION IS ALL YOU NEED
1.QKV结构，QKV是通过输入做Linear得到，Linear的权重为可学习参数；
2.通过QK点乘，得到对应的V的重要程度权重，再用权重与V乘，得到每个v加权后的注意力值；
3.QK点乘实际是计算的余弦相似度。

工具：

神经网络可视化工具（每一层输出的可视化，用以指导每层网络的设计是否合理）：https://blog.51cto.com/u_16099181/8552104

Winograd

卷积运算转为矩阵乘法后，存在很多重复值，等效稀疏矩阵，比普通矩阵实际少很多计算量。

http://www.dtcms.com/a/121830.html

相关文章：

【Proteus仿真】【32单片机-A009】矩阵按键系统设计

代码随想录-动态规划24

【Windows】Win2008服务器SQL服务监控重启脚本

golang gmp模型分析

【Game】Powerful——Martial Arts Challenge（6）

数据库实践题目：在线书店管理系统

高性能服务开发利器：redis+lua

Spring 框架的核心基础：IoC 和 AOP

【算法竞赛】回文字符串+思维模拟（蓝桥杯真题·回文字符串·代码清晰易懂）

巧记英语四级单词 Unit3-上【晓艳老师版】

【SpringCloud】从入门到精通（下）

TCP 与 UDP

Qt 开发时可以在函数内引用的头文件

国网B接口协议调阅实时视频接口流程详解以及检索失败原因（电网B接口）

蓝桥杯刷题总结 + 应赛技巧

MySQL表的增删查改（基础）

python学智能算法（九）|决策树深入理解

[前端]从人体结构看网页三要素：HTML、CSS 与 JavaScript

C#.NET模拟用户点击按钮button1.PerformClick自动化测试

动手人形机器人（RL）

去除Mysql表中的空格、回车、换行符和特殊字符

淘宝API与小程序深度联动：商品详情页“一键转卖”功能开发

NO.83十六届蓝桥杯备战|动态规划-基础线性DP|台阶问题|最大子段和|传球游戏|乌龟棋(C++)

Elasticsearch 集群搭建

Vue3+Vite+TypeScript+Element Plus开发-10.多用户动态加载菜单

Hi Robot——大脑加强版的π0：基于「VLM的高层次推理+ VLA低层次任务执行」的复杂指令跟随及交互式反馈

Python标准库-copy

FairMOT复现过程中cython_bbox库问题

go游戏后端开发32：自摸杠处理逻辑

Elasticsearch中的基本全文搜索和过滤