当前位置: 首页 > wzjs >正文

dede网站白屏恢复正常百度

dede网站白屏,恢复正常百度,丰都网站建设哪家好,网站前端浏览器兼容如何做当模型参数越来越大的情况下,如果我们的GPU内存比较小,那么就没办法直接进行全参数微调,此时我们可以借助deepspeed来进行微调。1、deepspeed的配置文件:$ more deepspeed.json {"train_batch_size": 4,"train_mi…

当模型参数越来越大的情况下,如果我们的GPU内存比较小,那么就没办法直接进行全参数微调,此时我们可以借助deepspeed来进行微调。

1、deepspeed的配置文件:

$ more deepspeed.json 
{"train_batch_size": 4,"train_micro_batch_size_per_gpu": 1,"zero_optimization": {"stage":1}
}

2、启动脚本run_deepspeed

$ more run_deepspeed 
export TRANSFORMERS_OFFLINE=1
export HF_DATASETS_OFFLINE=1
export PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512
export CUDA_VISIBLE_DEVICES=0,1,2,3
export CUDA_DEVICE_ORDER=PCI_BUS_ID
export PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True
export DS_SKIP_CUDA_CHECK=1
export TF_ENABLE_ONEDNN_OPTS=0
export CUDA_HOME="/usr/local/cuda-12.2"
export LIBRARY_PATH="/usr/local/cuda-12.2/lib64:$LIBRARY_PATH"
nohup deepspeed train.py > logd.txt 2>&1 &

3、真正的训练脚本:train.py

$ more train.py 
from datasets import load_dataset, DownloadConfig
from transformers import AutoTokenizer
from transformers import DataCollatorWithPadding
from transformers import TrainingArguments
from transformers import AutoModelForSequenceClassification
from transformers import Trainer
from sklearn.metrics import precision_scoredownload_config = DownloadConfig(local_files_only=True)
cache_dir = '/data1/dataset_cache_dir'
path = '/data1/data_0616'
raw_datasets = load_dataset(path=path, download_config=download_config,cache_dir=cache_dir)print(raw_datasets)model_name = "/data1/model/Qwen2.5-3B"tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.deprecation_warnings["Asking-to-pad-a-fast-tokenizer"] = True
print(tokenizer.pad_token)def tokenize_function(batch):return tokenizer(batch["title"], batch["text"], truncation=True, padding=True, max_length=512)tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)data_collator = DataCollatorWithPadding(tokenizer=tokenizer, padding='max_length', max_length=512)
output_dir = "/data1/result_0704"
training_args = TrainingArguments(output_dir=output_dir, evaluation_strategy="steps", num_train_epochs=100, learning_rate=5e-6,save_strategy="steps", greater_is_better=True, metric_for_best_model="precision",per_device_train_batch_size=1,per_device_eval_batch_size=1,deepspeed="deepspeed.json",load_best_model_at_end=True,local_rank=0,save_total_limit=10)model = AutoModelForSequenceClassification.from_pretrained(model_name, num_labels=2)
print(model.config.eos_token_id)
model.config.pad_token_id = model.config.eos_token_iddef compute_metrics(pred):labels = pred.label_idspreds = pred.predictions.argmax(-1)precision = precision_score(labels, preds, labels=[0], average='macro', zero_division=0.0)print('precision:', precision)return {"precision": precision}trainer = Trainer(model,training_args,train_dataset=tokenized_datasets["train"],eval_dataset=tokenized_datasets["validation"],data_collator=data_collator,tokenizer=tokenizer,compute_metrics=compute_metrics
)trainer.train()
print("train end")
results = trainer.evaluate()
print(results)

http://www.dtcms.com/wzjs/121243.html

相关文章:

  • b2b2c商城源码众志seo
  • 境外网站不备案盈利网页搭建
  • 韶关做网站的公司互联网推广怎么做
  • 图片合成器在线制作夫唯seo怎么样
  • 哪些网站可以做任务挣钱谷歌seo网站推广
  • wordpress添加搜索框seo推广的网站和平台有哪些
  • 深圳傻瓜式网站建设公司好吗浏览器下载安装2023版本
  • 乐清有那些网站如何利用网络广告进行推广
  • 路由侠怎么做网站映射广告外链购买交易平台
  • nodejs做网站还是appseo推广排名重要吗
  • 网站设计页面如何做居中志鸿优化设计
  • 网站建设与微店营销策划方案案例
  • 网站怎么做高权重长沙网站seo报价
  • 顺平网站建设口碑营销案例及分析
  • 淘宝网络营销案例分析福州网站seo公司
  • 网站建设费应怎样做会计分录厦门seo关键词排名
  • 企业网站的需求是什么友情链接建立遵循的原则包括
  • 贵州门户网站建设合肥网站制作
  • 做网站编辑好还是期刊编辑好怎样和政府交换友链
  • 做跨境电商要什么费用文山seo
  • 可以做数理化的网站云南省最新疫情情况
  • 做学校网站素材图片如何注册网站免费注册
  • 德州乐陵疫情最新消息今天seo自学网站
  • 网站的上一页怎么做的专业seo培训
  • 020网站建设和维护费用广告联盟平台排名
  • 容桂网站制作咨询做一个网站需要多少钱
  • 公司入口网站app百度开户代理商
  • 免费购物网站程序做一个网站需要多少钱大概
  • 西安SEO网站推广营销网站建设哪家快
  • 网站备案要先怎么做市场营销四大基本策略