当前位置：首页 > news >正文

LLM 学习2

news 2025/7/4 1:30:26

https://zhuanlan.zhihu.com/p/678196390

LLM context 长度，是模型在保障准确性的前提下，支持的最大输入长度。

一般来说，训练时用4k长度训练，那么推理时，4k以内的长度效果肯定是有保障的。8k以内的话，可以通往一些技术，如位置编码扩展等技术，让准确性基本不降低，或者降低幅度较小。超过训练长度太多，准确性就降低比较大了。

另外，一般情况下，训练和推理的运算量与长度的平方成正比例。有一些技术可以改善这方面。

重点要理解，LLM的结构参数中，是不包含context长度的，所以不够输入token多少，都是可以计算的。只是对运算量和准确性有影响。

此外，4000 token ，相当于 3000 个英文单词或者 2000 个汉字

ChromeDriver下载

2.19c++练习

express-validator 数据校验详解

Redis未授权访问漏洞原理

pandas连接mysql数据库

Zookeeper和Kafka的依赖关系

ubuntu22.4搭建单节点es8.1

一个前端，如何同时联调多个后端

Python 库自制 Cross-correlation 算法

【强化学习】随机策略的策略梯度

python 变量类型注释

自己安装一台DeepSeek的服务器

【Pandas】pandas Series reindex

MySQL 的存储引擎简介

“深入浅出”系列之C++：（21）C++23

Day41 移除链表元素

编译linux SDK

html网络安全工具源码网络安全前端