深度学习张量
一、张量在生产中的本质与特征值的关系
-
张量是特征的容器
- 用户特征(如年龄、学历、性别)在模型中存储为1维张量(向量),例如:
用户A特征向量 = [28, 5, 1]
(年龄=28,学历=硕士编码为5,性别男编码为1)14 - 多个用户的特征集合构成2维张量(矩阵):
| 用户ID | 年龄 | 学历 | 性别 | |--------|------|------|------| | 用户A | 28 | 5 | 1 | | 用户B | 35 | 3 | 0 |
- 加入时间维度(如用户行为序列)则升级为3维张量
(用户数, 时间步, 特征数)
14
- 用户特征(如年龄、学历、性别)在模型中存储为1维张量(向量),例如:
-
特征值是张量的元素
- 张量的每个标量元素(如
28
)才是一个具体的特征值16 - 张量通过维度组织特征值,例如:
- 0维张量:单值特征(如用户总积分)
- 1维张量:用户画像向量
- 2维张量:用户-商品交互矩阵
- 张量的每个标量元素(如
🛒 二、电商推荐场景中的张量应用
1. 用户分群与商品推荐
- 输入张量:
- 用户特征张量形状
(N, D)
:N
个用户,每个用户D
维特征(年龄、学历等)1314 - 商品特征张量形状
(M, K)
:M
个商品,每个商品K
维属性(类别、价格等)
- 用户特征张量形状
- 协同过滤中的张量运算:
- 用户-商品评分矩阵
R
(2维张量)分解为:
R≈U×VTR≈U×VT
U
(用户隐向量)、V
(商品隐向量)均为2维张量910
- 用户-商品评分矩阵
- 深度学习模型(如NCF):
- 将用户张量 & 商品张量输入神经网络,通过全连接层生成预测评分11
2. 高阶张量处理复杂关系
- 时序行为建模:
- 用户点击序列 → 3维张量
(用户, 时间步, 行为类型)
1011 - LSTM/Transformer 可直接处理此类张量,捕捉兴趣演化11
- 用户点击序列 → 3维张量
- 场景化推荐:
- 构建4维张量
(用户, 商品, 场景, 时间)
- 使用张量分解(CP/Tucker)提取跨维度关联910
- 构建4维张量
3. 落地案例与效果
场景 | 张量操作 | 效果 |
---|---|---|
用户聚类分群 | K-means 作用于用户特征矩阵(2维张量) | 精准划分高潜力用户群13 |
实时个性化推荐 | 张量点积计算用户-商品匹配度11 | 点击率提升 15%~30%14 |
跨渠道兴趣融合 | 3维张量拼接行为数据(APP/小程序/web) | 转化率提升 22%10 |
⚙️ 三、为什么必须用张量?核心优势
- 统一高维特征存储
- 兼容结构化特征(年龄、性别)与非结构化特征(行为序列、图像嵌入)14
- 高效并行计算
- GPU 对张量运算(矩阵乘法、卷积)有硬件级优化,提速百倍以上711
- 动态维度扩展
- 新增用户/商品时,仅需扩展张量维度,无需重构数据管道8
例如:用户兴趣变化时,只需在行为序列张量中追加新时间步的数据,模型可实时更新推荐结果1011。
💎 结论:张量是特征的载体而非特征本身
- 是:特征值的容器、模型运算的输入/输出单元
- 否:单个特征值(如“年龄=28”)
- 电商推荐必用:
- 用户画像 → 1维特征张量
- 用户群体分析 → 2维特征矩阵
- 行为建模 → 3维时序张量
通过张量组织百维特征,结合深度学习模型(如Wide & Deep),可实现精准的“千人千面”推荐11