当前位置: 首页 > wzjs >正文

南宁外贸网站建设国际新闻网站

南宁外贸网站建设,国际新闻网站,响应式网站 app,修改wordpress登陆后台参考B站BigC_666:微调BERT模型做情感分类实战,代码逐行讲解,100%可以跑通!!! 一键三连关注,私信即可获得代码_哔哩哔哩_bilibili 大致记录下出现了哪些问题 首先第一个问题是,huggingface.co无法访问,通过…

参考B站BigC_666:微调BERT模型做情感分类实战,代码逐行讲解,100%可以跑通!!! 一键三连+关注,私信即可获得代码_哔哩哔哩_bilibili

 大致记录下出现了哪些问题

首先第一个问题是,huggingface.co无法访问,通过修改环境变量让目标地址改到镜像地址也没起作用,最终解决方案是挂代理下载了

import os
os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890'
os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890'

后面就是jupyter代码了,修改了评估的部分

from datasets import load_datasetimport osimport os
os.environ['HTTP_PROXY'] = 'http://127.0.0.1:7890'
os.environ['HTTPS_PROXY'] = 'http://127.0.0.1:7890'os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
dataset = load_dataset("imdb")
print(dataset)import datasets
print(datasets.config.HF_DATASETS_CACHE)from transformers import BertTokenizer
tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
print("done")
def tokenizer_func(examples):return tokenizer(examples['text'],padding='max_length',truncation=True)
tokens_dataset = dataset.map(tokenizer_func,batched=True)
print(tokens_dataset)
print(tokens_dataset['train'][0])
train_dataset = tokens_dataset['train'].select(range(5000))
test_dataset = tokens_dataset['test'].shuffle(42).select(range(5000))
print(test_dataset['label'])from transformers import BertForSequenceClassificationclassifier = BertForSequenceClassification.from_pretrained('bert-base-uncased')from transformers import Trainer,TrainingArgumentstrain_arg = TrainingArguments(output_dir='./result',
#    eval_strategy='epoch',learning_rate=2e-5,per_device_train_batch_size=1,per_device_eval_batch_size=1,num_train_epochs=1,weight_decay=0.02
)
print('done')print('start')
trainer = Trainer(model = classifier,args = train_arg,train_dataset = train_dataset,eval_dataset = test_dataset
)
print('done')predictions = trainer.predict(test_dataset)import numpy as np
print('start')
# 模型输出的预测 logits(二维数组)
logits = predictions.predictions  # shape: (num_samples, num_classes)
labels = predictions.label_ids    # shape: (num_samples,)# 步骤1:将 logits 转换为预测标签(取最大值所在的索引)
predicted_labels = np.argmax(logits, axis=1)# 步骤2:计算准确率
accuracy = np.mean(predicted_labels == labels)print(f"Accuracy: {accuracy:.4f}")trainer.train()# metric = trainer.evaluate()
print(test_dataset['label'])predictions = trainer.predict(test_dataset)print(metric)print(predictions)from transformers import Trainer
from sklearn.metrics import accuracy_score
import numpy as np# 1. 定义 compute_metrics
def compute_metrics(eval_pred):predictions, labels = eval_predpreds = np.argmax(predictions, axis=1)return {"accuracy": accuracy_score(labels, preds)}# 2. 重新构造 Trainer(用原来的模型和训练参数)
new_trainer = Trainer(model=classifier,  # 你之前训练好的模型args=train_arg,   # 你原来使用的 TrainingArgumentscompute_metrics=compute_metrics
)# 3. 调用 predict
results = new_trainer.predict(test_dataset)print("准确率:", results.metrics["test_accuracy"])

代码比较混乱,可读性比较差,实验性质,各种参数没有详细的考量

http://www.dtcms.com/wzjs/207673.html

相关文章:

  • 网站收录降低冯耀宗seo博客
  • 自己如何建设个网站免费找客户软件
  • 我的世界怎么自己做皮肤并上传网站百度帐号
  • 一般公路建设招投标在什么网站上网站换了域名怎么查
  • 武汉阳网站建设平台营销渠道策划方案
  • 百度云如何建设网站nba最新排名榜
  • 哪个网站做网店好台州关键词优化服务
  • 网站经营许可备案自己做一个网站
  • 房地产管理局网站南宁seo外包服务商
  • 湖南广厦建设工程有限公司网站青岛百度关键词优化
  • 临沂做网站哪里好网站推广途径和要点
  • 呼市网站seo优化工资提成怎么算搜索引擎营销优化的方法
  • 大兴做网站的公司百度平台app下载
  • 网络代理网站好口碑关键词优化
  • 广告设计软件叫什么北京专业网站优化
  • 怎样建设微网站网站推广的基本方法
  • 岳阳仲裁委员会网站建设新增2022网站seo
  • 福州官网建站厂互换链接的方法
  • 做网站主播要什么条件网站描述和关键词怎么写
  • 用WordPress建什么站好数据交换平台
  • .net 开发门户网站今日国内新闻头条新闻
  • 如何建设企业电子商务网站百度搜索引擎原理
  • 什么是网站跳出率新的营销方式有哪些
  • 台州网站推广优化爱站网
  • 网站制作广网络推广渠道和方式
  • 做网站空间百度云和阿里云区别搜索关键词排名优化
  • 那个网站做网编好南京网站制作公司
  • 柳州搜索引擎营销平台seo推广软件怎样
  • 免费网站建设一级大陆seo 网站推广
  • 自己制作网站需要什么搜索引擎营销的作用