当前位置: 首页 > news >正文

动手学深度学习:手语视频在VGG模型中的测试

前言

其他所有部分同上一篇AlexNet一样,所以就不再赘诉,直接看VGG搭建部分。

模型

VGG是第一个采取块进行模块化搭建的模型。

def vgg_block(num_convs,in_channels,out_channels):
    layers=[]
    for _ in range(num_convs):
        layers.append(nn.Conv2d(in_channels,out_channels,kernel_size=3,padding=1))
        layers.append(nn.ReLU())
        in_channels=out_channels
    layers.append(nn.MaxPool2d(kernel_size=2,stride=2))
    return nn.Sequential(*layers)

可选择几个卷积之后再做池化,将这个做为一个块,在模型中多次使用。

conv_arch=((1,64),(1,128),(2,256),(2,512),(2,512))
def vgg(conv_arch):
    conv_blks=[]
    in_channels=len(frames_len)
    for (num_convs,out_channels) in conv_arch:
        conv_blks.append(vgg_block(num_convs,in_channels,out_channels))
        in_channels=out_channels
    return nn.Sequential(*conv_blks,nn.Flatten(),
                        nn.Linear(out_channels*7*7,4096),nn.ReLU(),nn.Dropout(0.5),
                        nn.Linear(4096,4096),nn.ReLU(),nn.Dropout(0.5),
                        nn.Linear(4096,len(labels))
net=vgg(conv_arch).to_device(device)#cuda

直接跟AlexNet模型替换就能使用。

简单来看一下这个模型,先做两次一个卷积外加一个池化,再做两次两个卷积外加一个池化,将整个网络的深度提升了很多。

结果

刚跑完,todesk就连接不上电脑了,所以就口述一下结果吧。

在上一次的10分类下,test的acc提高了20%左右,并且在增大frames_len的情况下,train的acc为100%,test的acc提升至90%,似乎是有捕获到视频的分类。

在100分类下的效果也还可以,train达到99.75%,test达到71%。

整体来看,VGG对于手语视频的分类是具有一定的效果的,对于其中的特征确实学习到了东西。

http://www.dtcms.com/a/130422.html

相关文章:

  • 测试 笔记
  • 【计网】网络交换技术之报文交换(复习自用,了解,重要3)
  • 0x06.Redis 中常见的数据类型有哪些?
  • FutureTask 源码解析
  • 深入剖析 Axios 的 POST 请求:何时使用 qs 处理数据
  • 0基础 | 硬件滤波 C、RC、LC、π型
  • 基于Springboot+Mysql的闲一品(含LW+PPT+源码+系统演示视频+安装说明)
  • [16届蓝桥杯 2025 c++省 B] 水质检测
  • Axure疑难杂症:详解横向菜单左右拖动效果及阈值说明
  • 在Fortran程序中嵌入Lua解释器
  • windows下Git安装及其IDEA配置
  • Spring - 13 ( 11000 字 Spring 入门级教程 )
  • Linux : 多线程互斥
  • 智享 AI直播3.0时代:无人智能系统如何颠覆传统拓客模式?‌‌
  • 计算机组成原理-指令系统
  • 集合框架二三事
  • 供应链业务-供应链全局观(三)- 供应链三流的集成
  • Transformer模型中的两种掩码
  • RK3588上Linux系统编译C/C++ Demo时出现BUG:The C/CXX compiler identification is unknown
  • 双向链表专题(C语言)
  • RK3576 GPIO 配置与使用
  • 【Docker】离线安装Docker
  • 【土堆 PyTorch 教程总结】PyTorch入门
  • 【频域分析】功率谱
  • Conda与Pip:Python包管理工具的对比与选型
  • Day15:关于MySQL的编程技术——基础知识
  • MDP最优控制问题转化为可求解的线性规划
  • dify应用例子
  • 一、springboot 整合 langchain4j 实现简单的问答功能
  • FreeRTOS(消息队列信号量队列集事件标志组)