当前位置: 首页 > wzjs >正文

怎么做非法彩票网站网站建设试用

怎么做非法彩票网站,网站建设试用,科技有限公司 翻译,网站软文得特点LLMLingua2 https://arxiv.org/pdf/2403.12968是LLMLingua的改进版本。我们知道 LLMLingua需要用小模型压缩,模型太小不一定能保证性能,模型太大耗费时间又太长。这个方法理论上可以,但实际上不是很方便用。很难选择到合适的小模型。 小模型…

LLMLingua2 https://arxiv.org/pdf/2403.12968是LLMLingua的改进版本。我们知道

  1. LLMLingua需要用小模型压缩,模型太小不一定能保证性能,模型太大耗费时间又太长。这个方法理论上可以,但实际上不是很方便用。很难选择到合适的小模型。

  2. 小模型压缩后的prompt在不同系列的大模型不一定能识别的准。

  3. 信息熵不一定是最好的压缩度量指标,比如胡乱的语句信息熵很高,但是确是无效错误的信息,通用模型压缩效果肯定不如专门训练的压缩模型效果好。

  4. 如何实现更高的压缩率,更强的通用性就是值得研究的问题。

1. 核心实现要点

基于上述的优化点,微软研究团队专门训练一个压缩的模型进行prompt 的compress,优化初版的LLMLingua,框架图如下:

 

  1. 数据蒸馏。在MeetingBank数据集上,借助GPT-4,构建严格的指令,指示GPT-4压缩文本,只丢弃原始文本中不重要的单词,并且在生成过程中不添加任何新单词,符号,保持原有的顺序,尽可能的短,得到prompt的压缩数据。从而构建一个压缩数据集。

 

2.  对于长上下文,GPT-4倾向于大幅压缩(估计和GPT-4处理长上下文的能力有限),容易丢失关键信息。因此将超长上下文分割成短上下文(比如512长),分段压缩+合并,其实就是map reduce 的方法。这样子获取得到长prompt的压缩数据。

3. 对原始的prompt数据和GPT4 压缩得到的prompt 进行数据标注,得到每一个token是不是preserve or discard的标签。简单的来讲就是在原始prompt中查找是不是找到了压缩prompt 中的token, 是则标签就是true(preserve), 否则标签就是fasle(discard)。

4. 使用transformer encoder架构作为分类模型的基础模型(multilingual-BERT),在最后一层加上一个线性分类层,对原始的prompt 进行编码,然后训练,

5. 训练的结果就是可以得到原始prompt中的每一个token的标签{preserve , discard}的概率。

6. 根据原始prompt和压缩后的prompt作为数据对,训练压缩模型。loss函数为预测结果和压缩prompt的交叉熵, 交叉熵特别适合应用在分类问题,可以衡量两个概率分布之间的差异。

 

 

7. 通过这样子训练出来的压缩模型就巧妙的将一个prompt中的每一个token转换为二分类问题,把分类结果是preserve的token 保留,就是压缩的结果。

 

http://www.dtcms.com/wzjs/837908.html

相关文章:

  • 深圳网站运营网站建设 清远魔方网络
  • 网站是别人做的域名自己怎么续费建网站的公司
  • 公司营销型网站建设西部域名网
  • 免费行情网站大全搜狐网2345浏览器官方网站
  • 中国空间站有几个舱段wordpress linux密码
  • 潍坊网站制作报价徐州好点的做网站的公司有哪些
  • 哪类型网站容易做做网站 先备案么
  • 环保网站建设模板免费下载拨号地址怎么做网站
  • 滨州网站建设公司电话网红营销的优势在哪里
  • 常州住房和城乡建设局网站首页大连市
  • 企业电商网站建设小程序商店图标
  • 做网站用lunx哈尔滨市建筑工程有限公司
  • 做网站公司工资电脑自己做网站可以吗
  • 如何拷贝网站代码做个什么样的网站
  • 百度热门关键词seo优化人员
  • 关于网站的建设论文铜陵app网站做招聘
  • 网页设计与网站建设论文河北网站开发
  • 长春网站排名公司苏州h5网站建设价格
  • 广州网站建设公司招聘百度竞价关键词出价技巧
  • 池州网站建设全包成都旅游发朋友圈的精美句子
  • 网站后台添加内容网页不显示陕西省建设总工会网站
  • 扬州大发网站建设魅姬直播
  • 淘宝优惠网站如何做做行业门户网站注意什么
  • 棋牌游戏网站模板下载安装祥云建站平台
  • 学做网站学费微信开放平台是干嘛的
  • 淮阳住房和城乡建设局网站广西美丽乡村建设网站
  • 成都网站制作汕头小程序开发公司排行榜
  • 宁波哪家建网站hao做网站 服务器多少钱一年
  • 湛蓝 网站开发wordpress数据库设置
  • 微信怎么做淘客网站域名和网站的关系