当前位置: 首页 > wzjs >正文

网站开发初级技术人员网站开发语言 知乎

网站开发初级技术人员,网站开发语言 知乎,创建一个数据库wordpress,wordpress页面排序MiniMind模型的web交互功能初试 一、前言 MiniMind提供了基于streamlit的web交互功能,能够即时切换模型和修改相关参数,经初步测试,具有比较好的体验感。本文介绍了使用MiniMind使用web交互功能的方法,并对使用中出现的问题给出…

MiniMind模型的web交互功能初试

一、前言

MiniMind提供了基于streamlit的web交互功能,能够即时切换模型和修改相关参数,经初步测试,具有比较好的体验感。本文介绍了使用MiniMind使用web交互功能的方法,并对使用中出现的问题给出了相应的解决方法。

二、测试模型准备

2.1、 模型下载

MiniMind已经训练好了多个模型,官网给出的模型下载地址为:

  • PyTorch原生模型
  • Transformers模型

可以从网站直接下载所需要的模型,也可以通过以下方式下载全部模型:

#SDK模型下载
from modelscope import snapshot_download
model_dir = snapshot_download('gongjy/MiniMind2-PyTorch')
#Git模型下载
git clone https://www.modelscope.cn/gongjy/MiniMind2-PyTorch.git

从官网给的Transformers模型下载链接看,MiniMind2目前只有PyTorch原生模型可以下载。

2.2、模型转换

MiniMind项目提供了通过streamlit实现了基本的web交互功能,程序为scripts目录里的web_demo.py。运行环境需要有streamlit,可以按如下方法安装:

pip install streamlit

然后启动网页对话程序:

streamlit run web_demo.py

很不幸,笔者运行的时候出现了以下错误提示:

ValueError: Unrecognized model in …/MiniMind2. Should have a model_type key in its config.json, or contain one of the following strings in its name: albert, align, altclip, aria, aria_text, audio-spectrogram-transformer, autoformer, aya_vision, bamba, bark, bart, beit, bert, bert-generation, big_bird, bigbird_pegasus, biogpt, bit, blenderbot, blenderbot-small, blip, blip-2, bloom, bridgetower, bros, camembert, canine, chameleon, chinese_clip, chinese_clip_vision_model, clap, clip, …

经检查程序,发现默认加载Transformers模型,直接把PyTorch模型放在模型路径下是不行的。因此需要使用scripts目录下的conver_model.py将PyTorch模型转换为Transformers模型。模型转换的相关参数按下表确定。

Model Nameparamslen_vocabn_layersd_model
MiniMind2-Small26M64008512
MiniMind2-MoE145M64008640
MiniMind2104M640016768
minimind-v1-small26M64008512
minimind-v1-moe4×26M64008512
minimind-v1108M640016768

如对于MiniMind2-Small模型,参数和路径设置如下:

    lm_config = LMConfig(dim=512, n_layers=8, max_seq_len=8192, use_moe=False)torch_path = f"../out/rlhf_{lm_config.dim}{'_moe' if lm_config.use_moe else ''}.pth"transformers_path = '../MiniMind2-Small'

转换后,会在模型路径下生成以下文件,用于Transformers加载:
modelfiles

三、PyTorch原生模型的加载方式

除了上述PyTorch模型转换为Transformers模型的方法外,还可以直接修改web_demo.py直接加载PyTorch模型。
主要修改如下:

#...
MODEL_PATHS = {"MiniMind2-MoE (0.15B)": ["../MiniMind2-PyTorch", "MiniMind2-MoE"],
}
#...
def main():#model, tokenizer = load_model_tokenizer(model_path) # 注释掉此行model_file = f'{MODEL_PATHS[selected_model][0]}/full_sft_640_moe.pth'model = MiniMindLM(LMConfig(dim=640,n_layers=8,max_seq_len=6400,use_moe=True))state_dict = torch.load(model_file, map_location=device)model.load_state_dict({k: v for k, v in state_dict.items() if 'mask' not in k}, strict=True)model.eval().to(device)tokenizer = AutoTokenizer.from_pretrained('./model/minimind_tokenizer')

这样web_demo.py程序就可以正确加载PyTorch模型。

四、web交互测试

MiniMind2-MoE模型测试:
start
模型切换和参数设置:
second

推理模型MiniMind2-R1测试:
reasonmodel


文章转载自:

http://K6c4Ohid.bnrff.cn
http://50arUwaI.bnrff.cn
http://UwxdSwt5.bnrff.cn
http://Zm26gQEX.bnrff.cn
http://Poi4HYjI.bnrff.cn
http://R0LuOeBE.bnrff.cn
http://2AJVwr3A.bnrff.cn
http://MvB0vWlv.bnrff.cn
http://Qub41wnj.bnrff.cn
http://7bv1XYsg.bnrff.cn
http://NFtQSgoa.bnrff.cn
http://bQt90pV2.bnrff.cn
http://mPRkSwpb.bnrff.cn
http://TH0Objli.bnrff.cn
http://WG7ZzdTo.bnrff.cn
http://DOJ6e1UD.bnrff.cn
http://85jYLbcz.bnrff.cn
http://dUSwCaSe.bnrff.cn
http://2jgA08sm.bnrff.cn
http://Hf7N9njh.bnrff.cn
http://FUPxjlef.bnrff.cn
http://OO8H43TO.bnrff.cn
http://ILM4617g.bnrff.cn
http://yDCaYDCM.bnrff.cn
http://ulkHxVmX.bnrff.cn
http://tv7RYfAE.bnrff.cn
http://RYiBRHyc.bnrff.cn
http://Zo1bu2xP.bnrff.cn
http://IxK4ck1m.bnrff.cn
http://H3gYe2hY.bnrff.cn
http://www.dtcms.com/wzjs/766194.html

相关文章:

  • 外贸网站设计方案建设商城类网站多少钱
  • 做任务给佣金的网站网站做图分辨率是多少合适
  • 网站源文件下载免费建设个人手机网站
  • 营销网站建设汉狮电话上海专业seo服务公司
  • 单位做网站需要准备什么不拦截网站的浏览器
  • 东营市城乡建设局网站wordpress 小论坛小程序
  • 程序源码网站加载wordpress外部文件路径
  • 2007年怎么做网站wordpress js效果
  • 制作网站多少钱一个传统营销与网络营销的区别
  • 网站维护界面网站开发网络公司兼职
  • 重庆万州网站建设哪家好html教程百度云
  • asp网站管理系统WordPress如何添加cnzz
  • 网站建设外包多少钱wordpress把所有东西导出
  • 如何用html制作网站深圳网站制作排行榜
  • 网站建设 网站专题 网络推广公司简介网站怎么做
  • 网站做服务端移动网站 用户体验
  • wx网站开发什么做网站开发
  • 怎么更新网站备案资料住房和城乡建设部文化中心网站
  • 网站规划明细表施工企业安全生产管理制度主要有
  • thinkphp微网站开发网站首页轮播怎么做
  • 毕业了智慧团建密码忘了宁波谷歌seo
  • 郑州个人网站开发网站建设对企业的帮助
  • 自建站网址seo和点击付费的区别
  • 玉田网站制作金湖县城乡建设局网站
  • pycharm网站开发网站的动画广告横幅怎么做的
  • 郫都区网站建设最便宜的外贸自建站平台
  • 秦皇岛网站设计做哪方面的网站好呢
  • zencart网站备份网站备案部门
  • 唐山住房和城乡建设厅网站微信小程序 做网站
  • 阿里指数官方网站福州展示网站制作的公司