当前位置: 首页 > wzjs >正文

dede网站白屏100条经典广告语

dede网站白屏,100条经典广告语,大型电商网站开发成本,一树擎天又一个wordpress站点当模型参数越来越大的情况下,如果我们的GPU内存比较小,那么就没办法直接进行全参数微调,此时我们可以借助deepspeed来进行微调。1、deepspeed的配置文件:$ more deepspeed.json {"train_batch_size": 4,"train_mi…

当模型参数越来越大的情况下,如果我们的GPU内存比较小,那么就没办法直接进行全参数微调,此时我们可以借助deepspeed来进行微调。

1、deepspeed的配置文件:

$ more deepspeed.json 
{"train_batch_size": 4,"train_micro_batch_size_per_gpu": 1,"zero_optimization": {"stage":1}
}

2、启动脚本run_deepspeed

$ more run_deepspeed 
export TRANSFORMERS_OFFLINE=1
export HF_DATASETS_OFFLINE=1
export PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512
export CUDA_VISIBLE_DEVICES=0,1,2,3
export CUDA_DEVICE_ORDER=PCI_BUS_ID
export PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True
export DS_SKIP_CUDA_CHECK=1
export TF_ENABLE_ONEDNN_OPTS=0
export CUDA_HOME="/usr/local/cuda-12.2"
export LIBRARY_PATH="/usr/local/cuda-12.2/lib64:$LIBRARY_PATH"
nohup deepspeed train.py > logd.txt 2>&1 &

3、真正的训练脚本:train.py

$ more train.py 
from datasets import load_dataset, DownloadConfig
from transformers import AutoTokenizer
from transformers import DataCollatorWithPadding
from transformers import TrainingArguments
from transformers import AutoModelForSequenceClassification
from transformers import Trainer
from sklearn.metrics import precision_scoredownload_config = DownloadConfig(local_files_only=True)
cache_dir = '/data1/dataset_cache_dir'
path = '/data1/data_0616'
raw_datasets = load_dataset(path=path, download_config=download_config,cache_dir=cache_dir)print(raw_datasets)model_name = "/data1/model/Qwen2.5-3B"tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.deprecation_warnings["Asking-to-pad-a-fast-tokenizer"] = True
print(tokenizer.pad_token)def tokenize_function(batch):return tokenizer(batch["title"], batch["text"], truncation=True, padding=True, max_length=512)tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)data_collator = DataCollatorWithPadding(tokenizer=tokenizer, padding='max_length', max_length=512)
output_dir = "/data1/result_0704"
training_args = TrainingArguments(output_dir=output_dir, evaluation_strategy="steps", num_train_epochs=100, learning_rate=5e-6,save_strategy="steps", greater_is_better=True, metric_for_best_model="precision",per_device_train_batch_size=1,per_device_eval_batch_size=1,deepspeed="deepspeed.json",load_best_model_at_end=True,local_rank=0,save_total_limit=10)model = AutoModelForSequenceClassification.from_pretrained(model_name, num_labels=2)
print(model.config.eos_token_id)
model.config.pad_token_id = model.config.eos_token_iddef compute_metrics(pred):labels = pred.label_idspreds = pred.predictions.argmax(-1)precision = precision_score(labels, preds, labels=[0], average='macro', zero_division=0.0)print('precision:', precision)return {"precision": precision}trainer = Trainer(model,training_args,train_dataset=tokenized_datasets["train"],eval_dataset=tokenized_datasets["validation"],data_collator=data_collator,tokenizer=tokenizer,compute_metrics=compute_metrics
)trainer.train()
print("train end")
results = trainer.evaluate()
print(results)

http://www.dtcms.com/wzjs/363134.html

相关文章:

  • 邢台疫情最新情况 最新消息宁波seo排名优化价格
  • 郑州网站开发比较好的网络公司怎么做盲盒
  • wordpress 4.7.3主题google seo实战教程
  • 新网站如何做搜索引擎收录深圳seo秘籍
  • 安康市城市建设局网站网络运营推广是做什么的
  • 重庆忠县网站建设公司百度一下你就知道官网下载安装
  • 定安免费建站公司成人大专
  • 山东济南网站建设公司哪家好百度关键词优化和百度推广
  • 网站建设的电话客服sem是什么专业
  • 宁波网站建设详细策划品牌运营推广方案
  • 今天西安新消息seo编辑是干什么的
  • 深圳做网站开发费用seo诊断网站
  • 推荐设计感强的网站百度建站官网
  • 携程旅游网站建设的定位seo编辑培训
  • 制造网站开发怎么做网站教程
  • 一般ps做网站大小多少seo优化师培训
  • 做网站前景怎么样全网营销思路
  • 做网站费用怎么入账百度账号个人中心
  • 网站建设需要准备什么信息流广告投放渠道
  • 北京中小企业网站建设网站优化推广教程
  • 网站做支付需要准备什么条件seo网站关键词优化快速官网
  • 有那些可以自己做壁纸的网站网站营销方案
  • 繁昌网站建设超级外链
  • 个人网站建设方案策划seo综合查询站长工具
  • 舟山做网站站长之家ip查询工具
  • 网站建站建设多少钱微信公众号推广软文案例
  • 邯郸网站建设公司崇左网站建设
  • 怎么在自己电脑上建网站网时代教育培训机构怎么样
  • 给人做阉割手术的网站宁波seo深度优化平台有哪些
  • 重启 iis 中的网站头条广告入口