当前位置: 首页 > wzjs >正文

营销型网站哪家好wordpress网站制作app

营销型网站哪家好,wordpress网站制作app,无法连接wordpress,每太营销咨询ICLR 2023 PatchTST (※※※) 摘要: 我们提出了一种高效的 Transformer 模型设计,用于多变量时间序列预测和自监督表示学习。该设计基于两个关键组件:(i)将时间序列划分为子序列级别的 patch&…

ICLR 2023 PatchTST (※※※)

摘要:

我们提出了一种高效的 Transformer 模型设计,用于多变量时间序列预测和自监督表示学习。该设计基于两个关键组件:(i)将时间序列划分为子序列级别的 patch,这些 patch 被作为输入 token 提供给 Transformer;(ii)通道独立性,即每个通道仅包含一个单变量时间序列,所有序列共享相同的嵌入层和 Transformer 权重。这种 patch 划分设计具有三方面的自然优势:能够在嵌入中保留局部语义信息;在相同的回溯窗口下,注意力图的计算和内存开销呈二次减少;模型可以关注更长的历史信息。 我们提出的通道独立 patch 时间序列 Transformer(PatchTST)在长期预测准确率上相较于当前最先进(SOTA)的 Transformer 模型有显著提升。我们还将该模型应用于自监督预训练任务,并在微调阶段取得了优异表现,甚至优于在大型数据集上进行的有监督训练。将经过掩码预训练的表示从一个数据集迁移到另一个数据集时,也能达到最先进的预测准确度。

论文地址:https://arxiv.org/pdf/2211.14730

代码地址:https://github.com/PatchTST/PatchTST

总结:

很厉害,

论文看不出来有多厉害。论文的话,跟iTransformer很相似,但是PatchTST更早。个人感觉iTransformer模仿了他的通道独立的点,实际上就是处理序列seq_len。只不过减少了计算量 用了这个patch的方法。

论文的结构也是比较清晰。 a图能看出来 这个方法是做的 通道独立。把每一维的时间数据通道隔开;b图就是对于每一个xi(第i个特征的输入)进行patch 变成 PxN(就是Patch-len * patch-Num) 这里的patch方式实现的也比较简单,然后进入后面的映射区和位置编码区,映射区的话实际上就是Linear 映射到d_model。 这里是把patch-len 映射为 d_model,然后进入transformer,最后进行flatten和linear head,实际上就是把 后两维 铺开,再linear 映射回 pred-len;c图的话就是利用自监督方式进行训练, 然后再通过微调 ,那预训练的话就需要把 后面的解码 换掉,换成输出掩码的 linear。

明天总结代码部分。

http://www.dtcms.com/wzjs/820946.html

相关文章:

  • 镇江网站定制wordpress用oss图床
  • yahoo怎么提交网站做网站用phpcms还是
  • 华为云网站定制宿迁网站开发
  • 关于建设校园网站申请沈阳网络seo公司
  • 具有价值的做网站哪个做企业网站
  • 做物流网站电话wordpress如何做云盘搜索
  • 原型样网站wordpress 更改用户名密码
  • 南庄建网站湖北民族建设集团网站
  • 临汾花果街网站建设在线设计网站排名
  • 微企业网站模板免费网页设计模板html代码教程图片
  • 网站建设和媒体渠道服装毕业设计代做网站
  • 江西省建设监督网站免费seo营销软件
  • 公众号自己做电影网站淘宝天猫优惠券网站怎么做
  • 外贸网站高端定做山西做网站的
  • 校园网站建设简介电影推荐算法 网站开发
  • 网站推广公司成功的经典案例邢台市政建设集团股份有限公司网站
  • cms系统和网站后台系统php cms
  • 浅析电商网站建设趋势机械电子工程专业知识网
  • 最有名的免费建站平台排行榜wordpress的简单介绍
  • 通州网站建设深圳建设厅网站
  • 重庆网站营销公司域名和空间的定义
  • 宁波网站建设托管免费信息推广网站
  • 镇江网站优化国家信用信息公示系统陕西
  • 网站建设及服务合同书泉州公司建设网站
  • 十大网络平台有哪些常熟seo关键词优化公司
  • 网站区域名怎么注册网站构架图怎么做
  • 六安哪家做网站不错做设计兼职的网站
  • 学校网站建设申请报告包装设计报价明细
  • 深圳营销型网站建设方案服务商品牌官网设计
  • 社区网站开发六安网站建设全包