当前位置：首页 > news >正文

多任务学习AITM算法简介

news 2025/11/7 18:38:00

解决什么问题？

有一类多任务具有前后依赖关系，比如CVR依赖CTR，比如出行领域的乘客取消动作发生在司机接单之后。
那么针对这类任务，大家都知道的是ESMM，AITM实在ESMM基础上更近一步。

主要创新点是什么？

模型结构上，引入了AIT模块，用于提取前序任务到目标任务的信息转移
损失函数方面，约束了前序任务的率大于后续任务

具体展开来讲

模型结构优化

AITM模型结构
如上图所示，t任务的输入包括两部分 $p_{t-1}$ 和 $q_t$ ，计算公式分别如下：
在这里插入图片描述

AIT则是一个self-attention模块，其中h为MLP，<>为点积。
在这里插入图片描述

我认为这里的AIT也可以调整为 $q_t$ 去attention $p_{t-1}$ ，做点积作为 $p_{t-1}$ 的权重，或者经过变化，类似QKV的前置变换。

损失函数优化

多任务学习的损失函数，除了每个任务本身的CE算是，这里加上了一个正则，用于约束任务t的输出概率小于任务t-1。
在这里插入图片描述

模型效果如何

在美团信用卡预估任务上提升还是挺明显的。
在这里插入图片描述

总结

创新点还是听清楚，不过总感觉PLE这样的网络，从信息共享和提取的角度，按理说能cover这个模型的效果？有实践经验的同学可以评论讨论下。

打个广告

我们团队还在招算法工程师，工作1-8年的都看，可以私聊我。

查看全文

http://www.dtcms.com/a/289440.html

虚拟机动态IP配置

MongoDB多节点集群原理 -- 复制集

玄机——第六章流量特征分析-蚂蚁爱上树

c语言进阶自定义类型（结构体位段）

LWJGL教程（3）——时间

【OD机试】池化资源共享

30天打牢数模基础-K近邻(KNN)讲解

`/etc/samba/smb.conf`笔记250719

【1】计算机视觉方法（更新）

Spring Boot 自动装配用法

Spring AI 聊天记忆

InfluxDB 核心概念与发展历程全景解读（一）

定点小数与分数

Laravel 框架NOAUTH Authentication required 错误解决方案-优雅草卓伊凡

Leetcode 124. 二叉树中的最大路径和

面向对象基础笔记

提升H7-TOOL自制nRF54L15脱机烧写算法文件速度，1MB程序仅需11秒，并且支持了UICR编程

C++23中的std::expected:异常处理

以“融合进化智领未来”之名，金仓Kingbase FlySync：国产数据库技术的突破与创新

SpringBoot集成Skywalking链路跟踪

CAN通讯理论与实践：调试和优化全讲解

20250720-2-Kubernetes 调度-资源限制对Pod调度的影响（1）_笔记

基于深度学习的目标检测：从基础到实践

尚庭公寓--------登陆流程介绍以及功能代码

常见的离散积分方法

基于bert-lstm对微博评论的情感分析系统设计与实现

《每日AI-人工智能-编程日报》--2025年7月20日

Direct3D 11学习（一）

Charles 的 Windows proxy 对爬取瑞数6 网站接口数据的作用分析

高性能架构模式——单服务器高性能模式（PPC与TPC）