当前位置: 首页 > news >正文

【论文阅读】多任务学习起源类论文《Multi-Task Feature Learning》

多任务特征学习

  • 前言
    • 1、背景假设
    • 2、一范式问题
    • 3、凸优函数
    • 4、实验

前言

该论文提出了一种通过低纬度表征多任务共性的方法.通过建立一个1维范式问题将多任务共同学习特征数进行正则化.这个问题等价于一个凸优化问题,用迭代算法进行求解.整个算法可以理解为非监督模块与监督模块,前者学习多任务的共同表征,后者使用该表征学习每个任务的目标.

论文获取
作者:Andreas Argyriou, Theodoros Evgeniou, Massimiliano Pontil
会议/期刊:Advances in Neural Information Processing Systems (NeurIPS), 2007

1、背景假设

定义特征维度为d,任务数为T, a i t a_{it} ait是第i个特征对任务t的回归参数,假设任务与特征之间的回归参数少许为0,也就是说特征维度里大多数与大部分任务都有关.
在这里插入图片描述
假设共享特征均为线性
在这里插入图片描述
,扩展为非线性可以表示为
在这里插入图片描述

,这样多任务的非线性特征W=U A,A为参数 a i t a_{it} ait的矩阵,我们知道a有些许为0,这意味着A有些行为0,W为低秩矩阵.

2、一范式问题

我们目标是求解共享特征u与回归参数a,首先固定u与任务t,可以得到其优化目标函数如下所示,因为问题较难求解,所以增加了a的一范式.
在这里插入图片描述
扩展到全部任务上得到
在这里插入图片描述

3、凸优函数

求解上式子是一项具有挑战性的任务,尽管在变量A和U中分别是凸的,整体上这是一个非凸问题。其次,范数不光滑,这使得求解变得更加困难。通过变换,得到下式子是一个凸函数问题(比较老的论文,证明不再展开)
在这里插入图片描述
在这里插入图片描述
这样,固定D,我们可以通过svm,或者回归类的方法求取w,然后再更新D,如此循环直到收敛,其具体求解过程如下所示:初始化D,W,输入x,y,遍历任务求取w,更新D(更新值的方式是通过低秩矩阵分解得到),然后重复求取w过程,直到满足收敛条件.
在这里插入图片描述

4、实验

这里主要注意一下实验所用的数据是180个人对20电脑品牌的倾向性,这个数据放到现在来说不算严格的多任务学习了,现在的多任务学习里任务间的差异会更大,比如同时预测销售额与销售量.因此不再展开讨论实验结果.值得注意的是该论文启发了许多基于稀疏性和低秩约束的后续研究.

相关文章:

  • 线程与协程
  • 实现多路视频截图预览之后上传到后台系统
  • 配置Linux的网络为静态IP地址的一些方法
  • HTML 列表、表格、表单 综合案例
  • 如何查看电脑系统的初始安装时间?
  • HTML 列表、表格、表单
  • Linux上并行打包压缩工具
  • 小天互连IM:信创体系下的安全、高效即时通讯新选择
  • 【强化学习】TD-MPC论文解读
  • 方案解读:智慧银行反欺诈大数据管控平台建设方案【附全文阅读】
  • Alpine Linux基本介绍与新手使用指南
  • 雷卯针对易百纳海鸥派海思SD3403 SS928智能视觉AI视觉国产化4K视频开发板防雷防静电方案
  • Java 枚举(Enum)的使用说明
  • tomcat的websocket协议升级。如何从报文交换变成全双工通信?session对象的注册和绑定?
  • 【WebRTC-14】webrtc是如何创建视频的软/硬编码器?
  • Linux ELF文件详解:深入理解可执行文件格式
  • 【模板编程】
  • Java八股文——JVM「类加载篇」
  • websocket实践
  • (41)课60--61高级篇: MySQL体系结构(连接层、服务层、引擎层、存储层)。存储引擎是基于表的,可为不同表指定不同的存储引擎;查询表结构语句 show create table 表名
  • 品牌设计书籍/天津的网络优化公司排名
  • 山西物价局建设工程检测网站首页/培训教育
  • 韩国什么网站是专做皮草的/百度快照是怎么做上去的
  • 一个人做网站难吗/实时热榜
  • 如何ping网站/自动收录网
  • 佛山做外贸网站的公司/抖音seo什么意思