当前位置: 首页 > news >正文

LLM论文笔记 19: On Limitations of the Transformer Architecture

  • Arxiv日期:2024.2.26
  • 机构:Columbia University / Google

关键词

  • Transformer架构
  • 幻觉问题
  • 数学谜题

核心结论

1. Transformer 无法可靠地计算函数组合问题

2. Transformer 的计算能力受限于信息瓶颈

3. CoT 可以减少 Transformer 计算错误的概率,但无法根本性突破其计算能力的上限

4. CoT 需要生成指数级增长的 token。CoT 只能通过增加大量的 token 来弥补 Transformer 的计算瓶颈,而不能从根本上提升 Transformer 的计算能力。

主要方法

核心目标是分析 Transformer 在计算能力上的根本性限制,特别是在 函数组合(Function Composition)、数学推理、逻辑推理 等任务上的表现。

通过 通信复杂度(Communication Complexity)计算复杂度(Computational Complexity) 的分析

参考:https://zhuanlan.zhihu.com/p/682254725

注:本系列不包括基础的知识点讲解,为笔记/大纲性质而非教程,用于论文知识点和思想和快速记忆和回顾,更多细节建议阅读论文原文

相关文章:

  • 【江协科技STM32】TIM编码器接口测速(学习笔记)
  • 【虚拟化】Docker Desktop 架构简介
  • SyntaxError: Illegal return statement
  • 【git】ssh配置提交 gitcode-ssh提交
  • 消防行业如何借助 TDengine 打造高效的数据监控与分析系统
  • DeepSeek-进阶版部署(Linux+GPU)
  • 随机过程的核心概念与Matlab实现
  • 乐鑫打造全球首款 PSA Certified Level 2 RISC-V 芯片
  • Python基于Django的医用耗材网上申领系统【附源码、文档说明】
  • Java中的设计模式违反了哪些设计原则
  • React基础之渲染操作
  • “双碳”背景下,企业应该如何提升能源效率?
  • Vue3路由组件和一般组件 切换路由时组件挂载和卸载 路由的工作模式
  • Nginx如何实现 TCP和UDP代理?
  • 选择排序算法的分析
  • Jenkins在Windows上的使用(一):用户配置
  • 计算机毕业设计SpringBoot+Vue.js美食烹饪互动平台(源码+文档+PPT+讲解)
  • C# CompareTo Compare 方法使用详解
  • Python-列表和元组
  • docker 如何更新容器内的环境变量,并覆盖创建这个容器的镜像?
  • 网站一年的维护费用/seo优化顾问服务
  • 三门峡高端网站建设/全国疫情高峰时间表最新
  • 做瞹瞹瞹视频免费网站/网站怎么优化排名
  • 百度收录哪个网站多/广告推广方式
  • 网站footer内容/模板建站
  • pageadmin仿站教程/最新实时大数据