Transformer模型设置评价模式:Dropout 停止随机丢弃神经元,从而保证每次输入得到的输出是确定的
Transformer模型设置评价模式
AutoModelForCausalLM.from_pretrained(model_name, device_map=“auto”, trust_remote_code=True).eval()
第一行代码
model_name = "/home/ZJQ/.cache/modelscope/hub/models/Qwen/Qwen2___5-7B-Instruct"
- 功能:这行代码定义了一个字符串变量
model_name
,其值为本地文件系统中预训练模型的存储路径。从路径来看,这里存储的是Qwen2 5 - 7B Instruct
模型,该模型很可能是从modelscope
这个模型仓库下载并缓存到本地的。 - 作用:后续代码会利用这个路径来加载模型和对应的分词器。