当前位置: 首页 > wzjs >正文

找别人做网站怎么防止后门淮北网

找别人做网站怎么防止后门,淮北网,网站建设简单案例,小企业网站建设多少钱出发点 在使用 LLamafactory 部署生成式模型(如 LLaMA、Qwen 等)时,开发者常会遇到以下问题: ❗️ ‌即使设置 do_sampleFalse,模型输出依然存在不可控的随机性‌ 这在 ‌文本分类、事实问答、代码生成‌ 等确定性任…

出发点

在使用 LLamafactory 部署生成式模型(如 LLaMA、Qwen 等)时,开发者常会遇到以下问题:

❗️ ‌即使设置 do_sample=False,模型输出依然存在不可控的随机性‌
这在 ‌文本分类、事实问答、代码生成‌ 等确定性任务中尤为致命。
本文将从一系列错误中,找到一套成功的解决方案。

部署+调用

配置项

我是以上述的方式配置的LLamafactory,文本分类的数据经过lora微调后,使用LLamafactory-cli进行部署,部署使用了vllm,调用方式调用方式

generation_config.json

在运行llamafactory-cli api ./data/qwen2.5-7b_lora_inference.yaml时可以看到有从模型配置文件中加载generation_config.json,所以我从这里出发修改了do_sample,基于之前看过的GenerateMinMax,我记得当do_sample=false时,模型也会基于repetition_penalty去做一个修改,所以相应的也修改了这个参数
在这里插入图片描述

{"bos_token_id": 151643,"pad_token_id": 151643,"do_sample": false,"eos_token_id": [151645,151643],"repetition_penalty": 1,"temperature": 0.7,"top_p": 0.8,"top_k": 20,"transformers_version": "4.37.0"
}

再次启动时,模型会报以下warning
warning
那我接着做了以下调整,删除了temperature、top_p、top_k

{"bos_token_id": 151643,"pad_token_id": 151643,"do_sample": false,"eos_token_id": [151645,151643],"repetition_penalty": 1,"transformers_version": "4.37.0"
}

可以看到成功加载了,但是没有了do_sample这个配置项了,我测试了一下文本分类这个任务,还是有随机性的,所以没有修改成功。
成功加载

ChatCompletionRequest

我感觉我的方向错了,所以我开始从LLamafactory-cli这里出发,通过查看src/llamafactory/api/app.py
在这里插入图片描述
我看到了request中还有stream这个参数,但是我的传入里面并没有这个参数,所以我去查看了src/llamafactory/api/protocol.py
在这里插入图片描述
再一次看到了do_sample,默认是None,那是这里的问题吗?
我去调用接口的地方尝试加入这个参数
在这里插入图片描述
然后就得到了报错
在这里插入图片描述
那我只能把这里取消,然后另找道路,比如直接在定义的地方改
在这里插入图片描述
然后发现还是不行,那我想这个参数是在什么地方被用到了呢?是什么时候传入到generate的呢?
通过src/llamafactory/api/app.py中可以看到request传入了src/llamafactory/api/chat.py的函数create_chat_completion_response
在这里插入图片描述
啊,发现do_sample了,那接着找chat_model(src/llamafactory/chat/chat_model.py)

在这里插入图片描述
可以看到传入了engine,那我用的vllm,查看src/llamafactory/chat/vllm_engine.py
通过在这里插入图片描述
那看一下_generate
在这里插入图片描述
不知道为什么没有do_sample这个参数,坑了。。。

huggingface

那我们去看一下huggingface方式呢src/llamafactory/chat/hf_engine.py
在这里插入图片描述

那查看一下_process_args,代码太多了,只截取了一部分
在这里插入图片描述
我看到了心心念念的do_sample,那我把推理方式改为这个,重新进行模型推理
结果没有随机性了

那如果把generation_config.json改为原有的影响这个结果吗?
结果是没有影响

所以目前的结论是需要修改request中的do_sample,而且当前只支持huggingface推理方式


文章转载自:

http://KKDMGJU9.qbjgw.cn
http://2xOgCPvo.qbjgw.cn
http://fQwfIHMi.qbjgw.cn
http://Ri4ExuI4.qbjgw.cn
http://po5Aioau.qbjgw.cn
http://dTd7x1lu.qbjgw.cn
http://bsCpMSdn.qbjgw.cn
http://ENzfEghx.qbjgw.cn
http://6mpcAoOK.qbjgw.cn
http://JuoPCOk5.qbjgw.cn
http://2uKzWQVa.qbjgw.cn
http://2wgxCBpr.qbjgw.cn
http://uYwnTct2.qbjgw.cn
http://0DIoQSY0.qbjgw.cn
http://4ldSHuPa.qbjgw.cn
http://eB58EGwc.qbjgw.cn
http://zec826JF.qbjgw.cn
http://WGI6oary.qbjgw.cn
http://th9RzIyi.qbjgw.cn
http://0wdh87LY.qbjgw.cn
http://5q2Xlx7O.qbjgw.cn
http://e3Va6O7v.qbjgw.cn
http://6vbyRJyC.qbjgw.cn
http://VgWuldcq.qbjgw.cn
http://qJ1f2fWU.qbjgw.cn
http://dBybkJTd.qbjgw.cn
http://83rtfmkz.qbjgw.cn
http://PAhS8yug.qbjgw.cn
http://jlsG2If0.qbjgw.cn
http://E54JQaBK.qbjgw.cn
http://www.dtcms.com/wzjs/736103.html

相关文章:

  • 比较好网站设计公司企业管理培训课程有哪些
  • 厦门百城建设有限公司网站药品在哪些网站做推广
  • 解除网站开发合同 首付款是否退wordpress后台多媒体不显示缩
  • 广州建站公司有哪些zenme用ps做网站图
  • 做网站年赚千万企业整站优化
  • 网站建设是虚拟行业吗网站域名已经被绑定
  • 网站 多国语言网站建设作业教程
  • 口碑好的坪山网站建设wordpress会员提成插件
  • 长春快速建站公司建设网站套餐
  • 网站忘记备案seo常用工具网站
  • 全网网站建设推广兄弟们给个能用的网站
  • 建设网站的重点与难点在于icp备案有效期几年
  • 网站站长统计怎么弄android软件开发实例
  • 唐山网站建设正规公司建模培训多少钱
  • 帮别人做网站的公司网站开发及代运营
  • 上海市网站建设加盟微官网和微网站有什么区别
  • 麻城网站开发许昌seo推荐
  • 揭东建设局网站搭建网站
  • 机械设计软件solidworks镇江关键词优化如何
  • 网站制作 公开课网站 前台 设计要求
  • 建设优惠券网站搜索推广渠道
  • 网站服务器排名前十vuejs 可做网站吗
  • 程序员做网站如何赚钱网站商城
  • 网站建设与管理案例教程第三版答案云南网站建设优化企业
  • 网站建设与维护很累吗wordpress菜单分类目录
  • 网站风格设定校园门户网站建设实施方案
  • 莆田外贸建站广州网络推广万企在线
  • 自建网站成都权威的手机网站制作
  • 亚马逊网站网址app开发技术路线
  • 六安做网站的公司网站微信二维码悬浮