当前位置: 首页 > wzjs >正文

dede网站版权信息修改谷歌商店下载

dede网站版权信息修改,谷歌商店下载,学编程能干什么,曲阜做网站当模型参数越来越大的情况下,如果我们的GPU内存比较小,那么就没办法直接进行全参数微调,此时我们可以借助deepspeed来进行微调。1、deepspeed的配置文件:$ more deepspeed.json {"train_batch_size": 4,"train_mi…

当模型参数越来越大的情况下,如果我们的GPU内存比较小,那么就没办法直接进行全参数微调,此时我们可以借助deepspeed来进行微调。

1、deepspeed的配置文件:

$ more deepspeed.json 
{"train_batch_size": 4,"train_micro_batch_size_per_gpu": 1,"zero_optimization": {"stage":1}
}

2、启动脚本run_deepspeed

$ more run_deepspeed 
export TRANSFORMERS_OFFLINE=1
export HF_DATASETS_OFFLINE=1
export PYTORCH_CUDA_ALLOC_CONF=max_split_size_mb:512
export CUDA_VISIBLE_DEVICES=0,1,2,3
export CUDA_DEVICE_ORDER=PCI_BUS_ID
export PYTORCH_CUDA_ALLOC_CONF=expandable_segments:True
export DS_SKIP_CUDA_CHECK=1
export TF_ENABLE_ONEDNN_OPTS=0
export CUDA_HOME="/usr/local/cuda-12.2"
export LIBRARY_PATH="/usr/local/cuda-12.2/lib64:$LIBRARY_PATH"
nohup deepspeed train.py > logd.txt 2>&1 &

3、真正的训练脚本:train.py

$ more train.py 
from datasets import load_dataset, DownloadConfig
from transformers import AutoTokenizer
from transformers import DataCollatorWithPadding
from transformers import TrainingArguments
from transformers import AutoModelForSequenceClassification
from transformers import Trainer
from sklearn.metrics import precision_scoredownload_config = DownloadConfig(local_files_only=True)
cache_dir = '/data1/dataset_cache_dir'
path = '/data1/data_0616'
raw_datasets = load_dataset(path=path, download_config=download_config,cache_dir=cache_dir)print(raw_datasets)model_name = "/data1/model/Qwen2.5-3B"tokenizer = AutoTokenizer.from_pretrained(model_name)
tokenizer.deprecation_warnings["Asking-to-pad-a-fast-tokenizer"] = True
print(tokenizer.pad_token)def tokenize_function(batch):return tokenizer(batch["title"], batch["text"], truncation=True, padding=True, max_length=512)tokenized_datasets = raw_datasets.map(tokenize_function, batched=True)data_collator = DataCollatorWithPadding(tokenizer=tokenizer, padding='max_length', max_length=512)
output_dir = "/data1/result_0704"
training_args = TrainingArguments(output_dir=output_dir, evaluation_strategy="steps", num_train_epochs=100, learning_rate=5e-6,save_strategy="steps", greater_is_better=True, metric_for_best_model="precision",per_device_train_batch_size=1,per_device_eval_batch_size=1,deepspeed="deepspeed.json",load_best_model_at_end=True,local_rank=0,save_total_limit=10)model = AutoModelForSequenceClassification.from_pretrained(model_name, num_labels=2)
print(model.config.eos_token_id)
model.config.pad_token_id = model.config.eos_token_iddef compute_metrics(pred):labels = pred.label_idspreds = pred.predictions.argmax(-1)precision = precision_score(labels, preds, labels=[0], average='macro', zero_division=0.0)print('precision:', precision)return {"precision": precision}trainer = Trainer(model,training_args,train_dataset=tokenized_datasets["train"],eval_dataset=tokenized_datasets["validation"],data_collator=data_collator,tokenizer=tokenizer,compute_metrics=compute_metrics
)trainer.train()
print("train end")
results = trainer.evaluate()
print(results)

http://www.dtcms.com/wzjs/467294.html

相关文章:

  • 做网站帮外国人淘宝江西seo推广方案
  • 施工企业在施工过程中发现设计文件和图纸有差错的网站优化建设
  • ps网站怎么做滑动背景sem竞价托管价格
  • 爱站关键词挖掘东莞网站优化关键词排名
  • 最安全的软件下载网站学开网店哪个培训机构好正规
  • 常州做网站哪家便宜百度推广服务费一年多少钱
  • 家电企业网站模板怎样宣传自己的产品
  • 济南哪有做网站的网络营销成功的案例分析
  • 一般网站有哪些模块国内5大搜索引擎
  • 长沙wap网站建设百度商店应用市场
  • 网站怎么建立数据库千峰培训出来好就业吗
  • 网站开发教材北京优化互联网公司
  • 深圳哪个公司做网站好竞价代运营公司
  • 网页设计自学视频网站百度经验官网
  • 网站每年都要备案吗优化营商环境条例
  • 模板网站的优缺点免费域名解析
  • wordpress 迁移 hexo云优化seo
  • asp网站怎么做301定向简述网站推广的方式
  • 天津免费建设网站泉州seo按天计费
  • 网站建设是专业如何弄一个自己的网站
  • 论坛网站制作费用怎么推广网站
  • 额尔古纳做网站百度公司电话
  • 河东天津网站建设seo教程seo教程
  • 网站后台插入不了图片免费网页模板网站
  • 怎么才能在百度上做引流呢百度seo搜索引擎优化方案
  • 网站 多国语言浅谈一下网络营销的几个误区
  • 网站放到iis如何做指向正规seo需要多少钱
  • 微软雅黑 b做网站要版权么百度学术论文查重
  • 安徽网站建设详细策划百度一下百度一下百度一下
  • 服装网购网站十大排名nba录像回放