当前位置: 首页 > wzjs >正文

wordpress 没有添加主题重庆关键词优化服务

wordpress 没有添加主题,重庆关键词优化服务,网站域名怎么填写,access 数据库做网站配套课程《AIGC大模型理论与工业落地实战》;Deepseek相关课程更新中 前置条件:一台可用的gpu服务器、ubuntu操作系统 1. 下载LLama-Factory 1.1. 安装anaconda或者miniconda,创建环境 bash Miniconda3-latest-Linux-x86_64.sh conda crea…

配套课程《AIGC大模型理论与工业落地实战》;Deepseek相关课程更新中

前置条件:一台可用的gpu服务器、ubuntu操作系统

1. 下载LLama-Factory

1.1. 安装anaconda或者miniconda,创建环境

bash Miniconda3-latest-Linux-x86_64.sh
conda create -n sft python=3.11
conda activate sft

1.2. 下载安装LLama-Factory

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

2. 启动LLama-Factory图形化界面

llamafactory-cli webui

3. 打开图形化界面

访问http://127.0.0.1:7860;或者”服务器IP地址+7860端口”。例如这里的是:http://180.184.146.134:7860/;打开图形化界面

4.下载模型到本地

这里以Qwen2.5-vl-7b-instruct模型为例,因为服务器是国内,从魔塔下载模型参数:

pip install modelscope
modelscope download --model Qwen/Qwen2.5-VL-7B-Instruct --local_dir /data2/users/yszhang/quickllm/qwen2.5-vl-instruct

执行上述指令后,模型参数被下载至:/data2/users/yszhang/quickllm/qwen2.5-vl-instruct文件夹:

(base) root@iv-ydg6wcq3ggay8n6dmn75:/data2/users/yszhang/quickllm/qwen2.5-vl-instruct# ll
total 16207084
drwxr-xr-x  3 root root       4096 May 13 09:36 ./
drwxr-xr-x 22 root root       4096 May 26 17:44 ../
drwxr-xr-x  3 root root       4096 May 12 16:36 .cache/
-rw-r--r--  1 root root       1050 May 12 16:36 chat_template.json
-rw-r--r--  1 root root       1374 May 12 16:36 config.json
-rw-r--r--  1 root root        216 May 12 16:36 generation_config.json
-rw-r--r--  1 root root       1519 May 12 16:39 .gitattributes
-rw-r--r--  1 root root    1671839 May 13 09:23 merges.txt
-rw-r--r--  1 root root 3900233256 May 13 09:31 model-00001-of-00005.safetensors
-rw-r--r--  1 root root 3864726320 May 13 09:36 model-00002-of-00005.safetensors
-rw-r--r--  1 root root 3864726424 May 12 17:22 model-00003-of-00005.safetensors
-rw-r--r--  1 root root 3864733680 May 13 09:31 model-00004-of-00005.safetensors
-rw-r--r--  1 root root 1089994880 May 13 09:26 model-00005-of-00005.safetensors
-rw-r--r--  1 root root      57619 May 12 16:36 model.safetensors.index.json
-rw-r--r--  1 root root        350 May 12 16:36 preprocessor_config.json
-rw-r--r--  1 root root      18574 May 12 16:36 README.md
-rw-r--r--  1 root root       5702 May 12 17:30 tokenizer_config.json
-rw-r--r--  1 root root    7031645 May 12 16:40 tokenizer.json
-rw-r--r--  1 root root    2776833 May 13 09:23 vocab.json
(base) root@iv-ydg6wcq3ggay8n6dmn75:/data2/users/yszhang/quickllm/qwen2.5-vl-instruct# 

5. 配置模型和数据

在图形化UI界面设置模型名称、模型路径和数据集,这里我以LLama-Factory中自带的多模态数据集“mllm_demo”数据集为例:

可以选择预览数据集,预览数据结构:

 

可以选择预览命令查看模型训练的实际指令,输出目录可以选择默认以时间戳命名的路径,确认没问题后点“开始”即可开始训练

 

训练时,在右下角可以实时查看loss下降的曲线,非常直观和方便:

 

6. 对话模型

训练好以后可以加载模型的lora参数,进行对话:

 

7.融合lora参数,导出模型

训练完成后,可以融合lora参数,导出作为一个新的模型。新的训练好的模型参数结构和原来的模型(例如qwen2.5-vl)结构一致。原来的模型怎么加载,新的模型就怎么加载

 

http://www.dtcms.com/wzjs/131277.html

相关文章:

  • 如东建设网站网站推广的方式有哪些?
  • 手机建站系统源码武汉seo首页优化技巧
  • 济南营销网站制作云南网站建设快速优化
  • 今天的西安今日头条手机优化大师官网
  • 建设企业网站的品牌营销包括哪些方面
  • 91成人无码免费一区二区百度小程序排名优化
  • html5动态网站模板下载代发广告平台
  • wordpress 自定义页面模板下载seo发帖网站
  • 专业网站设计公司推荐网络营销品牌推广公司
  • 在沧州盘古做苗木网站的电话营销话术
  • 购物网站模板免费下载博客seo优化技术
  • 做影视网站规模不大百度付费推广
  • 用什么网站做cpa网站流量查询工具
  • 怎么才能申请自己的网站如何创建一个自己的网站
  • 山东网站建设报价简述网站推广的意义和方法
  • 郑州做网站公司有多少品牌设计公司
  • 公司网站建设设计方案桌面百度
  • 网站出现死链怎么办网络事件营销案例
  • 请问番禺哪里有做网站的seo经验
  • 网站后台建设内容株洲seo优化报价
  • 临沂网站制作定制建网站流程
  • 微信小程序怎么批量删掉seo常用优化技巧
  • 江苏省建设工程质量监督站网站培训机构seo
  • 搭建网站哪个好如何提高自己在百度的排名
  • 一站式手机网站制作百度官网认证价格
  • 网络平台创建需要多少钱网络营销seo优化
  • 曲阜做网站百度统计代码安装位置
  • 新的龙岗网站建设百度关键词热度查询
  • 十堰网站建设价格重庆百度seo代理
  • php做的网站预览世界杯大数据