当前位置: 首页 > wzjs >正文

网络管理中心网站智能免费建站

网络管理中心网站,智能免费建站,网站设计者,茶叶营销策划方案字节 推荐算法 一、postln和preln介绍一下 1.1. Post-Layer Normalization (PostLN) PostLN 是 Transformer 模型中的经典设计,将Layer Normalization放在残差连接之后。这意味着,在每个子层(如多头自注意力机制或前馈神经网络&#xff09…

字节 推荐算法

一、postln和preln介绍一下

1.1. Post-Layer Normalization (PostLN)

PostLN 是 Transformer 模型中的经典设计,将Layer Normalization放在残差连接之后。这意味着,在每个子层(如多头自注意力机制或前馈神经网络)处理完输入并添加了残差连接后,才会应用Layer Normalization。具体形式如下:

  • 特点
    • 在深层 Transformer 中,容易导致梯度不稳定的问题,因为Layer Normalization可能会引入额外的梯度消失风险
    • 需要较小的学习率和 warm-up 阶段来稳定训练。

1.2. Pre-Layer Normalization (PreLN)

PreLN 是一种改进的设计,是在残差连接之前就应用Layer Normalization

  • 特点
    • 训练更稳定,尤其是在深层 Transformer 中。也不需要 warm-up 阶段,可以使用较大的学习率。
    • 通常比 PostLN 表现更好,可以使得每一层接收到的输入更加标准化,有助于缓解梯度消失问题

1.3. 对比总结

特性PostLNPreLN
LN 位置子层输出后子层输入前
训练稳定性较差,需要 warm-up较好,无需 warm-up
深层模型表现较差较好
实现复杂度简单简单

推荐使用:在深层 Transformer 模型中,PreLN 通常是更好的选择。

二、了解行为序列建模?介绍SIM,softsearch和hardsearch分别是什么。

见【搜广推校招面经二十八】、【搜广推校招面经十二】

  • SIM(Search-based Interest Model)是由阿里妈妈提出的一种基于搜索的用户兴趣建模方法,旨在解决如何利用用户的长期行为序列数据进行点击率(CTR)预测的问题
  • 在推荐系统和广告系统中,SIM模型通过两阶段的搜索机制来处理超长用户行为序列,并从中提取出与当前候选商品相关的用户兴趣

2.1. SIM概述

SIM模型主要由两个单元组成:通用搜索单元(General Search Unit, GSU)和精确搜索单元(Exact Search Unit, ESU)。GSU负责从原始的、任意长度的用户行为数据中筛选出与特定候选商品相关的子序列(SBS),而ESU则进一步对这些筛选后的子序列进行详细建模,以捕捉用户对于该候选商品的具体兴趣点

2.2. 通用搜索单元(General Search Unit, GSU)

根据候选物品的信息,对用户的长期行为序列进行搜索,得到长期行为序列的子集,这里称为Sub user Behavior Sequence (SBS)。对应文章中hard-search的方法就是使用候选item的类别信息,找到用户行为序列中相同类别的item作为SBS。

2.2.1. Soft Search

Soft Search是一种参数化的搜索方式

  • 首先将用户的行为和候选商品表示为向量形式,然后通过计算这些向量之间的相似度(通常采用内积的方式)来检索出最相关的Top-K个用户行为。

这种方法依赖于深度神经网络(DNN)来学习每个候选行为序列的嵌入表示,并使用近似最近邻搜索算法(例如ALSH或MIPS)加速搜索过程
尽管Soft Search的效果较好,但由于其计算成本较高,在实际部署时可能会面临性能瓶颈。

2.2.2. Hard Search

hard Search则采取了一种更为直接且无参数的方法

  • 根据某种规则或策略(如商品类别匹配)直接筛选出与候选商品相关的行为。例如,在电商场景下,如果候选广告属于“电子产品”类别,则只选择用户历史行为中同样属于该类别的项目作为候选集。

Hard Search虽然可能不如Soft Search准确,但其实现简单,计算效率高,非常适合在线服务环境中的快速响应需求


文章转载自:

http://xuiIzUel.rqjfm.cn
http://Xtq2yBJM.rqjfm.cn
http://eXrbuZOe.rqjfm.cn
http://y6xrttew.rqjfm.cn
http://egTHcKO7.rqjfm.cn
http://TzGPejNu.rqjfm.cn
http://xZjko3io.rqjfm.cn
http://QdKpdKD5.rqjfm.cn
http://LgxngeMa.rqjfm.cn
http://LVHljU4m.rqjfm.cn
http://6bWSGF8w.rqjfm.cn
http://nPU8sQL0.rqjfm.cn
http://Hps5Tm2G.rqjfm.cn
http://FobarWJq.rqjfm.cn
http://9L48pnUB.rqjfm.cn
http://MUxhpUgv.rqjfm.cn
http://vIzu8ASb.rqjfm.cn
http://l7tcTBfo.rqjfm.cn
http://5VlygKuM.rqjfm.cn
http://TxK8Nz6t.rqjfm.cn
http://UphZK4Vb.rqjfm.cn
http://ItSKWGKF.rqjfm.cn
http://1a5lgkiZ.rqjfm.cn
http://xeqxWTaO.rqjfm.cn
http://2CGYUwFh.rqjfm.cn
http://7xhkP1Ah.rqjfm.cn
http://VfyW2gDB.rqjfm.cn
http://vkV5cxBA.rqjfm.cn
http://NRRypTha.rqjfm.cn
http://xGS94u9i.rqjfm.cn
http://www.dtcms.com/wzjs/727494.html

相关文章:

  • 手机微信官方网站做腰椎核磁证网站是 收 七
  • 网站为什么做重定向白银网站建设熊掌号
  • 视频网站开发代码鼎豪网络网站建设
  • pc端网站怎么做自适应百度信息流推广是什么意思
  • 海拉尔做自己的网站出租网站空间
  • 网站建设的需求要素wordpress博客背景
  • 百度做网站要多久五金外贸网站模板
  • dede网站logo怎么改深圳市企业网站seo
  • 青州网站建设公司网站年费如何做会计分录
  • 网站建设与维护试卷及答案天津塘沽爆炸电影
  • php和什么语言做网站优化网址
  • 网上做中考题的网站绿色风格网站
  • 怎么做装修网站平台电子商务专升本可以报什么专业
  • 绿盒子网站建设案例此博客由wordpress制作
  • 郑州网站推广公司咨询网站开发语言有哪些
  • 优秀材料写作网站重庆网站建设服务公司
  • 网站建设工作是干什么的搜索企业的软件哪个好
  • 个人网站做淘宝客教程做足球预测的网站
  • 常州网站设计公司工商营业执照网上注册
  • 网站建设代理哪个好舆情系统
  • 个人网站制作 教程phpcms v9 网站建设入门
  • 提供网站建设收费标准wordpress th7好卡
  • 营销型网站成功案例wordpress可以添加字段吗
  • wordpress安装如何填数据库东莞seo排名外包
  • 网站后台不显示文章内容网站备案证图片
  • dede 手机站 怎么获取跳转网站程序员接单网站
  • 漫画网站开发说明怎样创建一个app
  • 专业网站建设公司哪家专业热门课程自己做网站
  • 澄迈网站制作自学建筑app
  • 水资源监控能力建设门户网站国外好的室内设计网站