当前位置: 首页 > wzjs >正文

网站的建设与运营产品营销方案策划书

网站的建设与运营,产品营销方案策划书,嘉鱼网站建设哪家专业,国内做led灯网站有接上文,本地配置Open-R1,用蒸馏量化版本DeepSeek-R1-distill-Qwen跑AIME2024评测失败了。想了半天,把本地环境全推了不可能,配docker又不太方便。不死心翻了翻最近配的4090机器,发现驱动刚好装了最新的,能够…

接上文,本地配置Open-R1,用蒸馏量化版本DeepSeek-R1-distill-Qwen跑AIME2024评测失败了。想了半天,把本地环境全推了不可能,配docker又不太方便。不死心翻了翻最近配的4090机器,发现驱动刚好装了最新的,能够支持CUDA12.4。

还好,失败了没有恼羞成怒的删了env和代码,赶紧打包放到这台机器上,改了几个路径问题,激活环境,调用torch和vllm都可以。

又开始跑测试脚本,第一个是解决离线无法下载模型和数据的事情。模型的话,因为之前介绍提到的,已经下载并测试了一般问题回答,因此,直接传到这个机器,修改模型路径MODEL即可。数据的话,要修改到./src/open-r1/evaluation.py中的LightevalTaskConfig中的hf_repo,改成本地路径就行,后面再看怎么传参数进去。按照repo把数据下回来,改好路径。

再次执行测试脚本,终于还是又出错了,RuntimeError: expected scalar type Half but found BFloat16。

MODEL=deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B
MODEL_ARGS="pretrained=$MODEL,dtype=bfloat16,max_model_length=32768,gpu_memory_utilisation=0.8"
OUTPUT_DIR=data/evals/$MODEL# AIME 2024
TASK=aime24
lighteval vllm $MODEL_ARGS "custom|$TASK|0|0" \--custom-tasks src/open_r1/evaluate.py \--use-chat-template \--output-dir $OUTPUT_DIR

原来是脚本里面的dtype问题,改成half和float16都行。但是,后面要是跑Q8及其他量化时,那是不是还是默认要转到float16或者bfloat16?那岂不是,只节省了存储,而不节省计算和带宽。要是性能再不好,那真是特别的好处了。

模型

AIME2024

@1 [6]

MATH500

@1 [7]

o1-mini [1]63.690.0
DeepSeek-R1-671B [1]79.897.3

DeepSeek-R1-distill-Qwen-1.5B [1]

28.983.9

DeepSeek-R1-distill-Qwen-7B [1]

55.592.8

DeepSeek-R1-distill-Qwen-32B [1]

72.694.3
Open-R1-1.5B [2]-81.2
Open-R1-7B [2]-91.8
Open-R1-32B [2]-95.0
bartowski/DeepSeek-R1-distill-Qwen-1.5B-f16 *23.368.8
bartowski/DeepSeek-R1-distill-Qwen-7B-Q8 *53.392.2
bartowski/DeepSeek-R1-distill-Qwen-32B-Q8 *70.095.6

表中数据来源,如下文献[1]和[2]。*号是编译Open-R1后,利用bartowski [3][4][5]中的蒸馏量化模型,在AIME2024和MATH500进行测试得到的。对比看,1.5B的性能差距是最大的,不知道是不是f16模型的问题?后面还得再check一遍。7B和32B,相比文[1]中的数据比较接近。后面还得再把DeepSeek自己提供的模型都测试一下。从模型大小看,应该是提供的FP16版本。

因此,整体上看,网络上提供的蒸馏模型还是基本可用的。如果是自己用LM studio跑着完,那1.5B模型就基本够用了。再加上,现在知乎、微信等等都接入了DeepSeek,当然这俩都是做的RAG,利用自己的数据,从回答上能明显看出来。同时,DeepSeek app目前也没有出现服务器忙的现象。

接下来,用LM Studio试试其他模型,比如llava,Mistral,Janus,Qwen2.5/-Instruct/-VL。还可以考虑把加载图片结合上DeepSeek-R1做题,以及图像生成模型。

 [1] DeepSeek-AI. DeepSeek_R1_Incentivizing Reasoning Capability in LLMs via Reinforcement Learning. GitHub - deepseek-ai/DeepSeek-R1

[2] https://github.com/huggingface/open-r1

[3] https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-1.5B-GGUF

[4] https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-7B-GGUF

[5] https://huggingface.co/bartowski/DeepSeek-R1-Distill-Qwen-32B-GGUF

[6] https://huggingface.co/datasets/HuggingFaceH4/aime_2024

[7] HuggingFaceH4/MATH-500 · Datasets at HF Mirror

http://www.dtcms.com/wzjs/21634.html

相关文章:

  • 廊坊建设局网站nba排行榜最新排名
  • 网站联盟有哪些策划书模板
  • 北京的制作网站的公司搜索引擎推广的三种方式
  • 浙江建设职业技术学院官网优化疫情防控措施
  • 版面设计图快速提高网站关键词排名优化
  • 广州番禺网站建设公司推荐优化工作流程
  • 做亚马逊学英语有什么网站吗百度24小时人工客服电话
  • 网站建设与运营实践考试免费域名 网站
  • 基于漏斗模型网站关键路径分析哈尔滨seo整站优化
  • 做易拉宝设计的网站2022年大事热点新闻
  • 网站开发设计流程图比较好用的搜索引擎
  • 网站建设页面会计培训班要多少钱一般要学多久
  • 广州做网站厉害的公司做seo要投入什么
  • 毕业设计网站建设题目反向链接查询
  • 服装销售网站设计与制作平台软件定制开发
  • 商标设计网课网站网络排名优化方法
  • 济南百度seo优化主要做什么
  • 网站建设管理是网络营销推广的优势
  • 手机web页面设计网站互动营销是什么意思
  • 中国工业设计网站长沙seo优化推广
  • 翻译网站素材宁波网站推广找哪家
  • 阳泉住房和城乡建设部网站网站建站流程
  • 我们高清在线观看免费韩剧seo的含义是什么意思
  • 大鹏网站建设关键词搜索量查询工具
  • 做旅游网站多少钱百度智能云官网
  • 深圳网站建设哪家强网站访问量统计工具
  • 网站添加二维码网络优化工程师招聘信息
  • 新疆建设监理协会网站网址注册查询
  • 北京网站建设好吗网站建站教程
  • 公司网站自己怎么建立免费引流app下载