当前位置: 首页 > news >正文

lmms-eval--微调实战笔记

lmms-eval--大模型调用平台,方便新手上手大模型微调
lmms-eval的更多用法,没有mathversehttps://github.com/EleutherAI/lm-evaluation-harness.git

单卡运行,模型gpt-j-6B,数据集hellaswag

git clone --depth 1 https://github.com/EleutherAI/lm-evaluation-harness
cd lm-evaluation-harness
pip install -e . -i https://pypi.tuna.tsinghua.edu.cn/simple#国内需要转镜像
export HF_ENDPOINT=https://hf-mirror.com#单卡运行,模型gpt-j-6B,数据集hellaswaglm_eval --model hf --model_args pretrained=EleutherAI/gpt-j-6B --tasks Math-PUMA/Math-PUMA_DeepSeek-Math-VL-7B --device cuda:0 --batch_size 8#多卡运行,模型gpt-j-6B,搞两个数据集lambada_openai,arc_easy
accelerate launch --multi_gpu --num_processes 8 \-m lm_eval --model hf \--tasks lambada_openai,arc_easy \--model_args parallelize=True \
--model_args pretrained=EleutherAI/gpt-j-6B\--batch_size 16#多卡运行,模型gpt-j-6B,搞两个数据集lambada_openai,arc_easy
accelerate launch --multi_gpu --num_processes 8 \-m lm_eval --model hf \--tasks AI4Math/MathVerse\--model_args parallelize=True \
--model_args pretrained=EleutherAI/gpt-j-6B,Math-PUMA/Math-PUMA_DeepSeek-Math-VL-7B\--batch_size 16

将数据集改为hf上的任意数据集,需要硬编码

相关文章:

  • 如何实现Kafka的Exactly-Once语义?
  • 输出圆周率的前n位数字
  • 含锡废水综合治理技术解析
  • Electron 入门指南
  • 【ACL系列论文写作指北08-图表设计规范】-让数据与结构一目了然
  • 深入探究C++ 中的stack、queue和deque
  • 数据结构之顺序表
  • Flask + ajax上传文件(四)--数据入库教程
  • 在自动驾驶数据闭环中的特征工程应用
  • JAVA-StringBuilder使用方法
  • vue代码规范管理
  • html css js网页制作成品——HTML+CSS甜品店网页设计(4页)附源码
  • 花费7元训练自己的GPT 2模型
  • 数组滑动窗口单调栈单调队列trick集【leetcode hot100 c++速查!!!】
  • 【wpf】 WPF中实现动态加载图片浏览器(边滚动边加载)
  • Python-librosa库提取音频数据的MFCC特征
  • 推荐私有化部署的企业内部通讯软件BeeWorks
  • 短视频矩阵系统贴牌批量剪辑功能开发,支持OEM
  • 反射与注解实现动态功能扩展案例-插件系统
  • 基于RSSI原理的Wi-Fi定位程序,N个锚点(数量可自适应)、三维空间,轨迹使用CKF进行滤波,附完整的代码,可复制粘贴
  • 上海:企业招用高校毕业生可享受1500元/人一次性扩岗补助
  • 遇冰雹天气,西安机场新航站楼成“水帘洞”
  • 习近平同俄罗斯总统普京举行会谈
  • 绍兴柯桥:用一块布托起中国制造的新经纬
  • 光大华夏:近代中国私立大学遥不可及的梦想
  • 中国以“大幅开放市场”回应贸易保护主义